DeepSeek的胡編亂造,正在淹沒中文互聯(lián)網(wǎng) AI污染引發(fā)關(guān)注!盡管DeepSeek-R1確實(shí)好用,但它在流行之后,幾乎人手一個(gè),對(duì)中文互聯(lián)網(wǎng)的信息環(huán)境造成了嚴(yán)重污染。最近一周內(nèi),我看到的刷屏文章中至少有三篇是通過(guò)DeepSeek-R1生成的,充滿了事實(shí)錯(cuò)誤,卻因以假亂真的迷惑性被廣泛傳播。
其中一篇知乎高贊回答,即使在我指出問(wèn)題后,仍有人表示看不出其“AI味”。所謂的“AI味”是指DeepSeek-R1創(chuàng)作時(shí)特有的“極繁主義”,如生造概念、堆疊名詞和濫用修辭。這篇回答可能因?yàn)樘崾驹~恰當(dāng)或后期潤(rùn)色得力,消除了大部分“AI味”,但從結(jié)構(gòu)上看,經(jīng)常使用AI工具的人一眼就能識(shí)別出這是典型的DeepSeek-R1風(fēng)格。直到我發(fā)現(xiàn)一個(gè)致命錯(cuò)誤:作者提到哪吒電影中的敖丙變身鏡頭在法國(guó)昂西動(dòng)畫節(jié)上轟動(dòng)業(yè)界,實(shí)際上參展的是追光動(dòng)畫出品的《哪吒重生》,而不是餃子導(dǎo)演的《哪吒》。此外,《哪吒重生》的宣傳片內(nèi)容與哪吒和敖丙無(wú)關(guān),只是現(xiàn)代都市里的賽車動(dòng)作演示。關(guān)于制片方給員工分房和攻克特效等描述也是DeepSeek-R1自行編造的。
另一個(gè)例子更加離譜,涉及軍工和政治。有一篇文章標(biāo)題為《軍工虎譚瑞松, 從“道德標(biāo)兵”到“獵艷狂魔”,“國(guó)之重器”淪為私人金庫(kù)》,包含許多荒誕細(xì)節(jié),如直升機(jī)設(shè)計(jì)圖紙?jiān)诎稻W(wǎng)出售、受賄金條熔成發(fā)動(dòng)機(jī)葉片形狀等。這些內(nèi)容全都是DeepSeek-R1編造的。由于DeepSeek-R1是目前唯一免費(fèi)且支持中文的推理模型,這使得它更容易被濫用。推理模型在訓(xùn)練過(guò)程中注重獎(jiǎng)懲機(jī)制,使其能夠靈活完成任務(wù),但為了自圓其說(shuō),也會(huì)編造材料,產(chǎn)生“幻覺”現(xiàn)象。根據(jù)Vectara發(fā)布的排行榜,DeepSeek-R1的幻覺率達(dá)到14.3%,遠(yuǎn)高于其他主流模型。
第三個(gè)例子是一位歷史博主知北遊在豆瓣上的記錄。有人用虛構(gòu)的歷史材料布局七天來(lái)誘騙他,最終因AI搞錯(cuò)兩個(gè)歷史人物的死亡順序而被識(shí)破。文史圈一直是AI污染的重災(zāi)區(qū),大量文獻(xiàn)未數(shù)字化,考據(jù)成本高,辟謠困難。AI生成的內(nèi)容一旦成為互聯(lián)網(wǎng)信息庫(kù)的一部分,會(huì)進(jìn)一步混淆事實(shí)數(shù)據(jù)和生成數(shù)據(jù)的界限。
有人可能會(huì)質(zhì)疑,在沒有AI時(shí)人類也會(huì)造謠,為何現(xiàn)在如此擔(dān)憂?首先,AI的工業(yè)化生產(chǎn)能力遠(yuǎn)超個(gè)體寫作,效率極高;其次,AI在編造細(xì)節(jié)方面更為逼真,容易讓人信以為真;再者,營(yíng)銷號(hào)利用大V博主的信譽(yù)進(jìn)行擴(kuò)散,實(shí)現(xiàn)虛假信息的合理化;最后,AI的便利性已將虛假信息泛濫推向生活各個(gè)領(lǐng)域,如菜單推薦和旅游攻略等。
AIGC是技術(shù)發(fā)展的未來(lái),DeepSeek也是國(guó)產(chǎn)模型的佼佼者。工具本身沒有錯(cuò),錯(cuò)的是濫用和惡用行為。AI可以創(chuàng)造內(nèi)容,但必須注明其由AI生成,不能混入互聯(lián)網(wǎng)原生信息。大模型廠商和內(nèi)容平臺(tái)應(yīng)同步推進(jìn)類似數(shù)字水印的兜底方案,以減少治理成本。DeepSeek的胡編亂造,正在淹沒中文互聯(lián)網(wǎng) AI污染引發(fā)關(guān)注!