池光耀告訴我們,這次V3的更新主要是3個(gè)方面的優(yōu)化,分別是
通信和顯存優(yōu)化
、
推理專家的負(fù)載均衡
以及
FP8混合精度訓(xùn)練
。
各個(gè)部分怎么實(shí)現(xiàn)的咱也就不多說(shuō)了,總體來(lái)說(shuō),大的整體結(jié)構(gòu)沒(méi)啥變化,更多的像是咱們搞基建的那一套傳統(tǒng)藝能,把工程做得更高效、更合理了。
首先,V3通過(guò)通信和顯存優(yōu)化,極大幅度
減少了資源空閑率
,提升了利用效率。
而推理專家
(具備推理能力的AI系統(tǒng)或算法,能夠通過(guò)數(shù)據(jù)分析得出結(jié)論)
的負(fù)載均衡就更巧妙了,一般的大模型,每次啟動(dòng),必須把所有專家都等比例放進(jìn)工位
(顯存)
,但真正回答用戶問(wèn)題時(shí),十幾個(gè)專家里面只用到一兩個(gè),剩下的專家占著工位
(顯存)
摸魚,也干不了別的事情。
而DeepSeek把專家分成熱門和冷門兩種,
熱門的專家,復(fù)制一份放進(jìn)顯存,處理熱門問(wèn)題;冷門的專家也不摸魚,總是能被分配到問(wèn)題
。
FP8混合精度訓(xùn)練則是在之前被很多團(tuán)隊(duì)嘗試無(wú)果的方向上拓展了新的一步,通過(guò)降低訓(xùn)練精度以降低訓(xùn)練時(shí)算力開銷,但卻神奇地保持了回答質(zhì)量基本不變。
也正是這些技術(shù)上的革新,才得到了大模型圈的一致好評(píng)。
通過(guò)一直以來(lái)的技術(shù)更新迭代,DeepSeek收獲的回報(bào)也是相當(dāng)驚人的。
00后女孩謙謙在云南普洱太陽(yáng)河森林公園工作,她在網(wǎng)上發(fā)布了與白眉長(zhǎng)臂猿的日常互動(dòng),引發(fā)眾多網(wǎng)友點(diǎn)贊。
2024-07-12 10:39:07女生在森林公園上班工作是巡山英偉達(dá)在GPU市場(chǎng)的主導(dǎo)地位持續(xù)增強(qiáng),人們期望AMD和Intel能展現(xiàn)出更強(qiáng)的競(jìng)爭(zhēng)力
2024-12-13 15:38:56英偉達(dá)全球GPU市場(chǎng)占比90%