DeepSeek-R1在某些情況下會出現(xiàn)“胡說八道”的現(xiàn)象,即幻覺,其幻覺率為14.3%,遠高于行業(yè)平均水平。這一問題主要源于數(shù)據(jù)、模型和應(yīng)用層的多重因素。
在Vectara HHEM人工智能幻覺檢測中,DeepSeek-R1顯示出14.3%的幻覺率,遠高于DeepSeekV3和行業(yè)平均水平。例如,在國際象棋游戲中,DeepSeek-R1出現(xiàn)了明顯的幻覺,如主動送兵線、虛構(gòu)規(guī)則更新等。
模型學習的大量知識中,有些事實或細節(jié)可能沒有被充分記住或理解,導致預(yù)測時產(chǎn)生錯誤。大模型的設(shè)計原理決定了它必須基于已有知識進行預(yù)測和補全,當遇到不熟悉或模糊的信息時,模型會自動“想象”,從而產(chǎn)生幻覺。此外,在某些應(yīng)用場景下,如科研檢索,模型可能會生成與真實世界知識相矛盾的信息。
幻覺可能導致信息錯誤,對決策和學術(shù)研究等產(chǎn)生誤導。但在某些創(chuàng)意性場景中,幻覺也可以被視為一種外在的想象力,激發(fā)人的靈感。
通過改進模型設(shè)計和訓練數(shù)據(jù)可以降低幻覺率。使用者應(yīng)了解模型的局限性,避免盲信盲從。同時,加強行業(yè)對AI模型的監(jiān)管和評估,確保模型的準確性和可靠性也很重要。
中俄兩國在日本海與鄂霍次克海區(qū)域聯(lián)合舉辦了名為“北部·聯(lián)合-2024”的軍事演習,這一舉動不僅是雙方軍事合作深化的體現(xiàn),也是地緣政治舞臺上的重要信號
2024-09-11 15:29:59大V分析中俄聯(lián)合演習目標2月12日,天風證券盤中漲停9.91%,截至14:44,股價報4.77元/股,成交額達23.06億元,換手率為5.96%,總市值為413.36億元
2025-02-12 20:02:35天風證券漲停分析