电竞下注-中国电竞赛事及体育赛事平台

<del id="maaos"></del>

中華網(wǎng) china.com

國內(nèi) 國際社會體育專題軍事財經(jīng) 滾動

DeepSeek V4最大的遺憾是什么 Engram缺席引發(fā)熱議

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-05-07 11:49:46 新浪財經(jīng)

DeepSeekV4的技術(shù)報告中提到了mHC、CSA、HCA、Muon和FP4等技術(shù)，但沒有提到Engram。這引發(fā)了網(wǎng)友們的熱議。Engram由DeepSeek和北京大學(xué)聯(lián)合開源，主要研究大模型的記憶與效率問題。自發(fā)布以來，它一直是討論的焦點。

Engram的設(shè)計初衷是解決模型在處理如“倫敦是英國首都”這樣的事實時，不需要動用整個深層網(wǎng)絡(luò)重新推理，而是可以直接查詢。這樣不僅節(jié)省了顯存，還能釋放深層網(wǎng)絡(luò)容量用于更高階的推理。因此，很多人認(rèn)為Engram會成為V4的基礎(chǔ)架構(gòu)。然而，在V4發(fā)表后，人們發(fā)現(xiàn)論文中并沒有提及Engram，這讓不少人感到遺憾。

盡管如此，Engram的理念和技術(shù)仍在繼續(xù)發(fā)展。三篇后續(xù)論文展示了Engram的應(yīng)用潛力。其中一篇論文詳細(xì)介紹了Engram的工作原理：通過在Transformer模型中加入一個原生知識查表模塊，使得模型能夠直接查詢靜態(tài)知識，從而減少計算量。具體來說，Engram在第2層和第15層之間插入了哈希查找機制，將當(dāng)前token和前面幾個token組成的N-gram映射到一個巨大的嵌入表中，直接取出對應(yīng)的向量。門控機制確保了查找到的內(nèi)容與當(dāng)前上下文匹配。

實驗結(jié)果顯示，Engram在知識密集型任務(wù)上表現(xiàn)優(yōu)異，并且在通用推理和代碼數(shù)學(xué)方面也有顯著提升。此外，Engram還被應(yīng)用于CXL內(nèi)存池化，以解決大規(guī)模模型的內(nèi)存問題。另一個研究者則嘗試優(yōu)化Engram的哈希查表沖突問題，但結(jié)果并不理想。還有一個團隊將Engram擴展到視覺領(lǐng)域，取得了不錯的效果。

雖然Engram沒有出現(xiàn)在V4中，但它的理念和技術(shù)已經(jīng)在多個方向上得到應(yīng)用和發(fā)展。

(責(zé)任編輯：0882)

關(guān)閉

黃金超越美債成最大儲備資產(chǎn)意味什么全球儲備結(jié)構(gòu)大變局

黃金超越美債成最大儲備資產(chǎn)意味什么2026-06-03 19:59:22

寸海不讓！那一聲怒吼背后的力量守護藍(lán)色國土

寸海不讓,那一聲怒吼背后的力量2026-06-03 19:56:41

女子連續(xù)多日為搶收農(nóng)機手送盒飯潁上好人溫暖田間

女子連續(xù)多日為搶收農(nóng)機手送盒飯2026-06-03 19:42:52

平陸運河全線通水進入有水調(diào)試階段

平陸運河全線通水2026-06-03 19:17:26

紀(jì)檢部門回應(yīng)公務(wù)員被曝腳踏兩條船私人感情糾紛引發(fā)關(guān)注

紀(jì)檢部門回應(yīng)公務(wù)員被曝腳踏兩條船2026-06-03 19:25:45

男子路上偶遇高考試卷押運車隊守護每一份努力與希望

男子路上偶遇高考試卷押運車隊2026-06-03 19:09:00

推遲三個月的告別：哈梅內(nèi)伊國葬敲定三城舉行三城送別最高領(lǐng)袖

推遲三個月的告別,哈梅內(nèi)伊國葬敲定三城舉行2026-06-03 15:42:52

黃仁勛稱員工薪水越高越好分享盈利增長紅利

黃仁勛稱員工薪水越高越好2026-06-03 09:57:14

男子救人溺亡兒女不知父已離世！

男子救人溺亡兒女不知父已離世2026-06-03 19:15:00

起底業(yè)務(wù)員虛假保單騙局高額返傭背后的貓膩

起底業(yè)務(wù)員虛假保單騙局2026-06-03 19:20:51

哈馬斯重申：愿移交加沙地帶治理權(quán) 否認(rèn)不愿交權(quán)指控

哈馬斯重申,愿移交加沙地帶治理權(quán)2026-06-03 16:06:21

退休夫妻離婚分割近億財產(chǎn)被移送公安巨額資產(chǎn)來源不明引發(fā)調(diào)查

退休夫妻離婚分割近億財產(chǎn)被移送公安2026-06-03 19:42:19

中國驅(qū)逐艦隊擴張迎里程碑 45艘服役現(xiàn)代化海軍崛起

中國驅(qū)逐艦隊擴張迎里程碑45艘服役2026-06-03 10:24:22

黃金超越美債成最大儲備資產(chǎn)意味什么全球儲備結(jié)構(gòu)大變局

黃金超越美債成最大儲備資產(chǎn)意味什么2026-06-03 19:59:22

男子盜竊女友財物獲刑虛榮心作祟觸法網(wǎng)

男子盜竊女友財物獲刑2026-06-03 19:26:16

特朗普簽署人工智能行政令加強AI技術(shù)監(jiān)督

特朗普簽署人工智能行政令2026-06-03 11:41:25

3歲男孩被過度保護只會說3個字愛的絆腳石

3歲男孩被過度保護只會說3個字2026-06-03 19:11:28

日菲炒作海域“劃界談判”目的何在針對中方海上布局

日菲炒作海域劃界談判目的何在2026-06-03 10:25:15

烏方發(fā)布基輔遭襲畫面多枚導(dǎo)彈引發(fā)爆炸傷亡慘重

烏方發(fā)布基輔遭襲畫面2026-06-03 09:57:32

中東多國拉響警報導(dǎo)彈與無人機真實攻擊

中東多國拉響警報2026-06-03 11:20:40

女子連續(xù)多日為搶收農(nóng)機手送盒飯潁上好人溫暖田間

女子連續(xù)多日為搶收農(nóng)機手送盒飯2026-06-03 19:42:52

俄軍大規(guī)模轟炸烏克蘭，傷亡數(shù)據(jù)出爐空襲規(guī)?？涨?/a>

俄軍大規(guī)模轟炸烏克蘭,傷亡數(shù)據(jù)出爐2026-06-03 09:53:21

歐洲議會投票通過歐美貿(mào)易協(xié)議立法文本待最終批準(zhǔn)

歐洲議會投票通過歐美貿(mào)易協(xié)議2026-06-03 09:59:24

俄稱烏襲擊頓涅茨克一客運汽車致7死烏方暫無回應(yīng)

俄稱烏襲擊頓涅茨克一客運汽車致7死2026-06-03 15:43:22

過去一夜中東局勢驟然升級阿聯(lián)酋倒戈引發(fā)連鎖反應(yīng)

過去一夜中東局勢驟然升級2026-06-03 10:27:02

俄烏戰(zhàn)況：烏稱俄發(fā)動大規(guī)模襲擊俄發(fā)射巡航導(dǎo)彈打擊烏軍用機場澤連斯基呼吁歐美支援

俄烏戰(zhàn)況,烏稱俄發(fā)動大規(guī)模襲擊俄發(fā)射巡航導(dǎo)彈打擊烏軍用機場2026-06-03 09:22:43

荔枝龍眼雜交新品種“懷石”來了全球首例跨屬雜交成功

荔枝龍眼雜交新品種懷石來了2026-06-03 19:28:43

曝印尼準(zhǔn)備買24架殲-10CE 精明采購策略揭曉

曝印尼準(zhǔn)備買24架殲-10CE2026-06-03 16:08:26

男子嫉妒前女友入職銀行入室殺人控制欲與嫉妒釀悲劇

男子嫉妒前女友入職銀行入室殺人2026-06-03 19:29:14

基輔60秒內(nèi)遭4枚導(dǎo)彈襲擊烏克蘭經(jīng)歷“最艱難一天”

基輔60秒內(nèi)遭4枚導(dǎo)彈襲擊2026-06-03 16:10:27

中國機器人“出海潮”的喜與憂從規(guī)模到價值的跨越

中國機器人出海潮的喜與憂2026-06-03 09:56:59

69歲老人高燒不退，竟是家中“萌寵”惹禍！

家中新添鸚鵡后老人高燒不退2026-06-03 19:14:32

寸海不讓！那一聲怒吼背后的力量守護藍(lán)色國土

寸海不讓,那一聲怒吼背后的力量2026-06-03 19:56:41

男子打麻將輸錢敲詐勒索獲刑8個月舉報威脅獲刑罰

男子打麻將輸錢敲詐勒索獲刑8個月2026-06-03 19:20:21

九寨溝越野賽181人抄近道被處罰賽事公平受挑戰(zhàn)

九寨溝越野賽181人抄近道被處罰2026-06-03 19:23:04

相關(guān)新聞

今日熱點

中方敦促菲方停止海上侵權(quán)挑釁勿煽宣炒作

幼童坐家長懷中在地庫道路駕駛SUV 危險行為引熱議

小車轉(zhuǎn)彎未減速觀察致三車事故司機全責(zé)被罰

山東發(fā)布強對流天氣預(yù)警雷雨大風(fēng)來襲

頻道熱點

主編郵箱
網(wǎng)上不良信息舉報電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務(wù) | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動態(tài)
版權(quán)所有中華網(wǎng)

<abbr id="mq2ay"></abbr>