电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

國內(nèi) 國際社會(huì) 體育專題軍事財(cái)經(jīng) 滾動(dòng)

DeepSeek的新模型很瘋狂：整個(gè)AI圈都在研究視覺路線，Karpathy不裝了(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-10-21 13:55:19 新浪財(cái)經(jīng)

這種壓縮方法或許能大幅擴(kuò)展模型的有效上下文長度，特別是與DeepSeek幾周前發(fā)布的稀疏注意力機(jī)制論文結(jié)合時(shí)。盡管谷歌可能已經(jīng)掌握了類似技術(shù)，但DeepSeek選擇完全開源，包括模型權(quán)重和方法細(xì)節(jié)，使得任何人都可以試驗(yàn)并進(jìn)一步探索這一突破。

Hacker News等平臺(tái)上，DeepSeek-OCR引發(fā)了廣泛討論。Django Web框架的聯(lián)合創(chuàng)建者Simon Willison成功在英偉達(dá)Spark硬件上運(yùn)行了該模型，整個(gè)過程僅用了40分鐘。科技視頻播主NiceKate AI也將其部署到了Mac上。

不過，一些研究者指出，DeepSeek的新模型雖然工程上取得了巨大成功，但其核心思路并非首創(chuàng)。早在2022年，哥本哈根大學(xué)等機(jī)構(gòu)的論文《Language Modelling with Pixels》就提出了基于像素的語言編碼器PIXEL，旨在解決語言模型的詞匯瓶頸問題。此后，還有多篇研究成果對這一思路進(jìn)行了發(fā)展和改進(jìn)。

盡管如此，DeepSeek-OCR確實(shí)是一個(gè)非常實(shí)用的模型，已有不少先行者開始使用。但也有人批評其方法缺乏漸進(jìn)性。無論如何，DeepSeek-OCR的發(fā)布無疑為大模型領(lǐng)域帶來了新的思考方向。

首頁上一頁 12共 2 頁

(責(zé)任編輯：0882)

關(guān)閉

民進(jìn)黨當(dāng)局公告日本5地核食管制解禁引發(fā)島內(nèi)嘩然疑慮

民進(jìn)黨當(dāng)局公告日本5地核食管制解禁2025-11-24 12:35:55

上周末我國多領(lǐng)域迎來新突破捷報(bào)頻傳

上周末我國多領(lǐng)域迎來新突破2025-11-24 12:34:14

專家：高市錯(cuò)誤言論暗藏三大意圖挑戰(zhàn)中方底線

專家,高市錯(cuò)誤言論暗藏三大意圖2025-11-24 12:17:03

美國宇航局發(fā)布神秘星際天體新圖像，揭示了其真實(shí)本質(zhì)，成功擊破持續(xù)數(shù)周的網(wǎng)絡(luò)謠言！

美國宇航局發(fā)布神秘星際天體新圖像,揭示了其真實(shí)本質(zhì),成功擊破持續(xù)數(shù)周的網(wǎng)絡(luò)謠言2025-11-24 12:10:22

中國無人駕駛重卡開進(jìn)英國最大港口科技風(fēng)景線閃耀菲力斯杜港

中國無人駕駛重卡開進(jìn)英國最大港口2025-11-24 12:02:23

美國為什么從日本撤走“堤豐”中程導(dǎo)彈系統(tǒng)？局勢突變引發(fā)撤離

美國為什么從日本撤走堤豐中程導(dǎo)彈系統(tǒng)2025-11-24 10:57:57

中國004航母核動(dòng)力真相曝光戰(zhàn)斗力驚人或成全球最大航母

中國004航母核動(dòng)力真相曝光戰(zhàn)斗力驚人2025-11-24 11:29:29

日本發(fā)生大火今晨仍未被撲滅火勢持續(xù)蔓延

日本發(fā)生大火今晨仍未被撲滅2025-11-24 12:07:47

加總理：即使沒有美國世界也可以運(yùn)轉(zhuǎn) G20共識(shí)仍具分量

加總理,即使沒有美國世界也可以運(yùn)轉(zhuǎn)2025-11-24 10:59:03

湖人再勝爵士客場險(xiǎn)勝迎4連勝

湖人再勝爵士2025-11-24 12:14:08

高市早苗被拒進(jìn)入日本相撲擂臺(tái) 傳統(tǒng)規(guī)定引發(fā)爭議

高市早苗被拒進(jìn)入日本相撲擂臺(tái)2025-11-24 11:12:00

首個(gè)報(bào)道南京大屠殺的記者王火去世百歲人生見證歷史

首個(gè)報(bào)道南京大屠殺的記者王火去世2025-11-24 10:49:10

最新！訂單爆棚的公司名單來了，12家獲機(jī)構(gòu)扎堆關(guān)注業(yè)績增長催化劑

最新,訂單爆棚的公司名單來了,12家獲機(jī)構(gòu)扎堆關(guān)注2025-11-24 12:09:39

上周末我國多領(lǐng)域迎來新突破捷報(bào)頻傳

上周末我國多領(lǐng)域迎來新突破2025-11-24 12:34:14

張家界荒野求生決賽開始 14強(qiáng)選手迎終極挑戰(zhàn)

張家界荒野求生決賽開始2025-11-24 12:01:59

日本為啥急于重啟柏崎刈羽核電站能源危機(jī)下的無奈選擇

日本為啥急于重啟柏崎刈羽核電站2025-11-24 11:07:05

公然挑釁，執(zhí)意玩火！高市早苗挑釁言論會(huì)造成什么樣的惡果？

高市早苗挑釁言論會(huì)造成什么惡果2025-11-24 11:28:33

官方通報(bào)三無飛機(jī)問題面條廠造飛機(jī)暗藏風(fēng)險(xiǎn)

官方通報(bào)三無飛機(jī)問題2025-11-24 12:06:13

特朗普猛烈抨擊烏克蘭領(lǐng)導(dǎo)層感激危機(jī)背后的博弈

特朗普猛烈抨擊烏克蘭領(lǐng)導(dǎo)層2025-11-24 10:57:34

中國軍隊(duì)堅(jiān)定捍衛(wèi)國家主權(quán) 維護(hù)地區(qū)和平穩(wěn)定

中國軍隊(duì)堅(jiān)定捍衛(wèi)國家主權(quán)2025-11-24 10:50:52

南通崇川區(qū)原一級調(diào)研員陳躍生被查涉嫌嚴(yán)重違紀(jì)違法

南通崇川區(qū)原一級調(diào)研員陳躍生被查2025-11-24 12:01:39

公然挑釁，執(zhí)意玩火！高市早苗挑釁言論會(huì)造成什么樣的惡果？

焦點(diǎn)訪談,高市執(zhí)意玩火必將自取滅亡2025-11-24 10:47:48

日本奪島方案“揭秘” 自衛(wèi)隊(duì)三套計(jì)劃曝光

日本奪島方案揭秘2025-11-24 12:03:36

日本一工廠發(fā)生火災(zāi)火勢無法控制持續(xù)8小時(shí)未減弱

日本一工廠發(fā)生火災(zāi)火勢無法控制2025-11-24 12:10:03

石破茂再批高市早苗外交政策遭嚴(yán)厲批評

石破茂再批高市早苗2025-11-24 11:11:33

韓國總統(tǒng)希望早日訪華推進(jìn)中韓合作

韓國總統(tǒng)希望早日訪華2025-11-24 12:04:17

美發(fā)布“委領(lǐng)空預(yù)警”是要?jiǎng)邮至藛?歷史重演？

美發(fā)布委領(lǐng)空預(yù)警是要?jiǎng)邮至藛?/span>2025-11-24 10:49:39

英偉達(dá)力推對華芯片銷售中美關(guān)系緩和現(xiàn)曙光

英偉達(dá)力推對華芯片銷售2025-11-24 11:05:20

專家：高市錯(cuò)誤言論暗藏三大意圖挑戰(zhàn)中方底線

專家,高市錯(cuò)誤言論暗藏三大意圖2025-11-24 12:17:03

美國專家批評高市錯(cuò)誤言論轉(zhuǎn)移國內(nèi)注意力

美國專家批評高市錯(cuò)誤言論2025-11-24 11:06:37

日本民眾批評高市早苗要求其辭職平息局勢

日本民眾批評高市早苗2025-11-24 11:04:51

男子臥鋪車廂排便旅客鞋子箱子遭殃醉酒惹禍端

男子臥鋪車廂排便旅客鞋子箱子遭殃2025-11-24 12:05:33

日媒宣傳“敵國條款”已廢除，事實(shí)真是如此嗎？中國官方重申條款真相

日媒宣傳敵國條款已廢除,事實(shí)真是如此嗎2025-11-24 11:08:23

民進(jìn)黨當(dāng)局公告日本5地核食管制解禁引發(fā)島內(nèi)嘩然疑慮

民進(jìn)黨當(dāng)局公告日本5地核食管制解禁2025-11-24 12:35:55

樊振東店長工作牌樊振東任小米一日店長

樊振東店長工作牌2025-11-24 11:59:36

相關(guān)新聞

DeepSeek開源新模型DeepSeek-OCR 探索視覺-文本壓縮邊界
10月20日，人工智能團(tuán)隊(duì)DeepSeek AI發(fā)布了全新多模態(tài)模型 DeepSeek-OCR
2025-10-20 20:33:14DeepSeek開源新模型DeepSeek-OCR
DeepSeek使用率暴跌原因何在？新模型R2缺席影響顯著
由于新模型R2遲遲未發(fā)布，DeepSeek近期備受關(guān)注。國際知名半導(dǎo)體研究機(jī)構(gòu)Semianalysis的報(bào)告顯示，DeepSeek的用戶使用率從年初的7.5%峰值顯著下降至3%，官網(wǎng)流量同期下滑近三成
2025-07-10 13:25:04DeepSeek使用率暴跌原因何在
DeepSeek為何發(fā)表研究成果揭示AI模型秘密
證券時(shí)報(bào)的文章內(nèi)容僅供參考，不構(gòu)成實(shí)質(zhì)性投資建議，據(jù)此操作風(fēng)險(xiǎn)自擔(dān)。下載“證券時(shí)報(bào)”官方APP或關(guān)注官方微信公眾號(hào)，可以隨時(shí)了解股市動(dòng)態(tài)，洞察政策信息，把握財(cái)富機(jī)會(huì)
2025-09-20 12:51:47DeepSeek為何發(fā)表研究成果
DeepSeek在《自然》雜志公布論文 R1模型成本創(chuàng)新低
AI初創(chuàng)公司DeepSeek的論文最近登上了《自然》雜志。該公司表示，其強(qiáng)大的AI模型R1的成功并不依賴于模仿其他大型語言模型生成的示例進(jìn)行訓(xùn)練。這一聲明隨著R1模型同行評審版本的發(fā)布而公布
2025-09-20 12:18:52DeepSeek在自然雜志公布論文
DeepSeek開源新版R1 媲美OpenAI 性能媲美o3模型
DeepSeek開源了R1最新0528版本，盡管官方未對此版本進(jìn)行詳細(xì)說明，但已有網(wǎng)友在著名代碼測試平臺(tái)Live CodeBench中發(fā)現(xiàn)其性能可與OpenAI最新的o3模型高版本相媲美
2025-05-29 08:46:15DeepSeek開源新版R1媲美OpenAI
DeepSeek R1模型已完成小版本試升級官方邀您體驗(yàn)
5月28日，DeepSeek官方宣布，DeepSeek R1模型已完成小版本試升級。用戶可以前往官方網(wǎng)頁、APP或小程序測試新功能，API接口和使用方式保持不變
2025-05-29 08:41:18DeepSeekR1模型已完成小版本試升級

今日熱點(diǎn)

乘用車為何“越造越重” 電動(dòng)化與需求升級推高車重

男子開鎖騎車被五步蛇咬中電動(dòng)車下藏險(xiǎn)情

野生玉米中“找回”丟失基因科研團(tuán)隊(duì)取得突破

2188元一碗面日均賣出幾十碗：只要味道好顧客就覺得值

頻道熱點(diǎn)

主編郵箱
網(wǎng)上不良信息舉報(bào)電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務(wù) | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動(dòng)態(tài)
版權(quán)所有中華網(wǎng)