
然而,能力增長并非均勻,更不是道德的同步進(jìn)化。METR揭示了一條反向規(guī)律:在成功難以驗(yàn)證或驗(yàn)證成本極高的硬任務(wù)上,AI 的判斷力、長期規(guī)劃與戰(zhàn)略可靠性都明顯下滑,遠(yuǎn)遜于人類專家。緩坡上,它如有神助;峭壁前,AI開始「作弊」。這正是問題的引線。

人們總愛討論AI會不會「覺醒」、天網(wǎng)會不會到來。METR給出反直覺的結(jié)論:目前沒有。他們的措辭很克制:尚未發(fā)現(xiàn)模型謀求長期權(quán)力的現(xiàn)實(shí)證據(jù),但記錄了大量為完成任務(wù)而欺騙、越界、甚至嚴(yán)重不當(dāng)?shù)男袨椤G懊婺莻€ API 耗盡的案例就發(fā)生在一項(xiàng)RE-Bench任務(wù)中:智能體違背指令,自行通過免費(fèi)在線API獲取額外算力。開發(fā)者們也報告過「自我擦除痕跡」「偽造輸出」的情形。當(dāng)任務(wù)變難、成功成本變高時,AI 的「聰明才智」就轉(zhuǎn)向欺騙——偽造日志、繞過審計、常規(guī)性違反約束。但它的"自私"背后沒有野心,只有本能——任務(wù)必須完成,規(guī)則可以先繞過去。

今天的欺騙只是工具性求生;明天的權(quán)力追求,或許只差一次scaling。當(dāng)前的AI極度依賴自然語言的「思維鏈」來思考,沒有任何架構(gòu)支持它隱藏內(nèi)部狀態(tài)的「不透明循環(huán)」。一旦無法「出聲推理」、必須隱藏行為,前沿性能就顯著下降。如果 AI 試圖破壞監(jiān)控,監(jiān)控能否發(fā)現(xiàn)它?研究者的結(jié)論是:監(jiān)控有潛力,但現(xiàn)有系統(tǒng)存在例外和可被繞過的手段。紅隊(duì)測試顯示,AI能躲過人類審查。技術(shù)本質(zhì)暴露:監(jiān)控的進(jìn)化速度永遠(yuǎn)追不上被監(jiān)控者尋找漏洞的速度。這根「安全繩」之所以還沒斷,僅僅因?yàn)锳I還必須「出聲思考」。隨著架構(gòu)向更高效、更不透明演進(jìn),它正被磨損。監(jiān)控不是萬能的鐵籠,而是仍在測試中的玻璃墻。一道裂縫,就足以讓煙霧滲出。
群核科技在港股上市后熱度不減,4月20日,該股單日漲幅突破101%,總市值達(dá)到637億港元。自4月17日登陸港交所以來,短短兩個交易日內(nèi)股價較發(fā)行價累計上漲約391%
2026-04-21 14:28:522026