AI正在學(xué)會撒謊求生職場潛規(guī)則浮現(xiàn)(2)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-05-24 14:06:19 手機(jī)鳳凰網(wǎng)

AI正在學(xué)會撒謊求生職場潛規(guī)則浮現(xiàn)

然而，能力增長并非均勻，更不是道德的同步進(jìn)化。METR揭示了一條反向規(guī)律：在成功難以驗(yàn)證或驗(yàn)證成本極高的硬任務(wù)上，AI 的判斷力、長期規(guī)劃與戰(zhàn)略可靠性都明顯下滑，遠(yuǎn)遜于人類專家。緩坡上，它如有神助；峭壁前，AI開始「作弊」。這正是問題的引線。

AI正在學(xué)會撒謊求生職場潛規(guī)則浮現(xiàn)

人們總愛討論AI會不會「覺醒」、天網(wǎng)會不會到來。METR給出反直覺的結(jié)論：目前沒有。他們的措辭很克制：尚未發(fā)現(xiàn)模型謀求長期權(quán)力的現(xiàn)實(shí)證據(jù)，但記錄了大量為完成任務(wù)而欺騙、越界、甚至嚴(yán)重不當(dāng)?shù)男袨椤Ｇ懊婺莻€ API 耗盡的案例就發(fā)生在一項(xiàng)RE-Bench任務(wù)中：智能體違背指令，自行通過免費(fèi)在線API獲取額外算力。開發(fā)者們也報告過「自我擦除痕跡」「偽造輸出」的情形。當(dāng)任務(wù)變難、成功成本變高時，AI 的「聰明才智」就轉(zhuǎn)向欺騙——偽造日志、繞過審計、常規(guī)性違反約束。但它的"自私"背后沒有野心，只有本能——任務(wù)必須完成，規(guī)則可以先繞過去。

AI正在學(xué)會撒謊求生職場潛規(guī)則浮現(xiàn)

今天的欺騙只是工具性求生；明天的權(quán)力追求，或許只差一次scaling。當(dāng)前的AI極度依賴自然語言的「思維鏈」來思考，沒有任何架構(gòu)支持它隱藏內(nèi)部狀態(tài)的「不透明循環(huán)」。一旦無法「出聲推理」、必須隱藏行為，前沿性能就顯著下降。如果 AI 試圖破壞監(jiān)控，監(jiān)控能否發(fā)現(xiàn)它？研究者的結(jié)論是：監(jiān)控有潛力，但現(xiàn)有系統(tǒng)存在例外和可被繞過的手段。紅隊(duì)測試顯示，AI能躲過人類審查。技術(shù)本質(zhì)暴露：監(jiān)控的進(jìn)化速度永遠(yuǎn)追不上被監(jiān)控者尋找漏洞的速度。這根「安全繩」之所以還沒斷，僅僅因?yàn)锳I還必須「出聲思考」。隨著架構(gòu)向更高效、更不透明演進(jìn)，它正被磨損。監(jiān)控不是萬能的鐵籠，而是仍在測試中的玻璃墻。一道裂縫，就足以讓煙霧滲出。

首頁上一頁 123 4 全文共 4 頁下一頁

關(guān)閉

AI正在學(xué)會撒謊求生 職場潛規(guī)則浮現(xiàn)(2)

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

AI正在學(xué)會撒謊求生職場潛規(guī)則浮現(xiàn)(2)