外界對(duì)馬斯克再次開(kāi)源算法的反應(yīng)并不完全是技術(shù)理想主義,而是現(xiàn)實(shí)壓力。過(guò)去一年里,X因其內(nèi)容分發(fā)機(jī)制屢次陷入爭(zhēng)議,被批評(píng)在算法層面偏袒右翼觀點(diǎn)。去年發(fā)布的一份研究報(bào)告指出,X的推薦系統(tǒng)在政治內(nèi)容傳播上出現(xiàn)了明顯的新偏見(jiàn)。在這種背景下,馬斯克強(qiáng)調(diào)算法透明性很難被簡(jiǎn)單解讀為一次純粹的技術(shù)決策。
X推薦算法開(kāi)源后,有用戶總結(jié)了五點(diǎn)推薦機(jī)制的關(guān)鍵點(diǎn): - 回復(fù)評(píng)論對(duì)曝光率有很大影響。 - 鏈接會(huì)降低曝光率,應(yīng)放在個(gè)人簡(jiǎn)介或置頂帖里。 - 觀看時(shí)長(zhǎng)至關(guān)重要,視頻/帖子需要吸引用戶停留。 - 堅(jiān)守細(xì)分領(lǐng)域,偏離領(lǐng)域會(huì)影響分銷(xiāo)渠道。 - 屏蔽或默不作聲會(huì)大幅降低分?jǐn)?shù),要有爭(zhēng)議但不要令人討厭。
盡管架構(gòu)開(kāi)源,但還有一些內(nèi)容未公開(kāi),如權(quán)重參數(shù)、隱藏模型權(quán)重和訓(xùn)練數(shù)據(jù)。對(duì)于普通用戶而言,更高的透明度可以解釋為什么有些帖子能獲得曝光而另一些則無(wú)人問(wèn)津,并使研究人員能夠研究平臺(tái)如何對(duì)內(nèi)容進(jìn)行排名。
推薦系統(tǒng)是互聯(lián)網(wǎng)巨頭商業(yè)模式的重要組成部分。亞馬遜、Netflix、YouTube和Meta等公司都依賴(lài)推薦系統(tǒng)來(lái)推動(dòng)購(gòu)買(mǎi)、觀看時(shí)長(zhǎng)和商業(yè)轉(zhuǎn)化。然而,傳統(tǒng)推薦系統(tǒng)面臨著工程復(fù)雜度極高的問(wèn)題。大型語(yǔ)言模型的出現(xiàn)為推薦系統(tǒng)提供了一條新的可能路徑,簡(jiǎn)化了工程復(fù)雜度并帶來(lái)了交叉學(xué)習(xí)的潛力。
專(zhuān)家傅聰認(rèn)為,X的這套推薦系統(tǒng)依然遵循傳統(tǒng)的多階段漏斗篩選架構(gòu),grok沒(méi)有參與中間過(guò)程,只是作為排序模型。他指出,實(shí)現(xiàn)每日處理上億條內(nèi)容并進(jìn)行實(shí)時(shí)多模態(tài)理解需要極其充足的GPU算力和高并發(fā)處理引擎。此外,成本效益方面,Grok方法需要大量計(jì)算資源,這使得這種方式目前只屬于極少數(shù)平臺(tái)。他還提到,大語(yǔ)言模型有自己的偏好,可能會(huì)構(gòu)建新的信息繭房。開(kāi)源代碼對(duì)工業(yè)交流有一定參考意義,但對(duì)學(xué)術(shù)研究?jī)r(jià)值不大。