AI進(jìn)化的速度比你想象的還慢 AGI仍遙不可及

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-11-12 14:36:20 新浪財(cái)經(jīng)

AI進(jìn)化的速度比你想象的還慢 AGI仍遙不可及！關(guān)于AI何時(shí)能超越人類的問題，業(yè)界普遍認(rèn)為實(shí)現(xiàn)AGI（通用人工智能）是關(guān)鍵。簡單來說，就是創(chuàng)造出和人一樣聰明的AI。比如馬斯克和OpenAI的奧特曼都頻繁提到AGI即將到來。

然而，如何衡量AGI的水平卻是個(gè)難題。人的智力差異巨大，難以用單一標(biāo)準(zhǔn)來衡量。即使是那些經(jīng)常討論AGI的大佬們也難以給出明確的定義。

最近，一群頂尖專家聯(lián)合發(fā)表了一篇論文，給出了首個(gè)AGI的量化定義。他們認(rèn)為AGI應(yīng)該達(dá)到一個(gè)受過良好教育的成年人的能力。為此，他們引入了心理學(xué)中的CHC理論，將AI的能力分為十個(gè)核心維度，每個(gè)占10%的分值：通識(shí)知識(shí)、讀寫能力、數(shù)學(xué)能力、即時(shí)推理、工作記憶、視覺處理、聽覺處理、反應(yīng)速度、長期記憶存儲(chǔ)和長期記憶檢索。

工作記憶指的是短期記憶，而長期記憶則是指AI通過對話永久性學(xué)到新東西。每種能力都有專門的測試題。例如，在即時(shí)推理方面，他們會(huì)提出一些燒腦的問題來測試AI的能力。

研究團(tuán)隊(duì)用GPT-4和GPT-5進(jìn)行了測試。結(jié)果顯示，GPT-4總分27，GPT-5總分58，均未達(dá)到滿分。具體來看，GPT-5在通識(shí)知識(shí)、讀寫能力和數(shù)學(xué)能力上表現(xiàn)較好，但在長期記憶存儲(chǔ)和長期記憶檢索方面得分很低。這說明目前的AI在持續(xù)學(xué)習(xí)和記憶方面存在嚴(yán)重缺陷。

此外，視覺處理也是AI的一大短板。GPT-4得分為零，GPT-5也只有4分。視覺推理對大模型來說非常困難，例如識(shí)別哪些2D展開圖不能折成立方體這樣的問題。

盡管這份報(bào)告并不完美，但它為當(dāng)前的AI提供了一次全面診斷，揭示了AI在一些基本認(rèn)知能力上的缺陷。同時(shí)，它也提醒人們，通過捷徑掩蓋弱點(diǎn)的AI無法真正實(shí)現(xiàn)AGI。

有人質(zhì)疑這種標(biāo)準(zhǔn)是否合理，認(rèn)為AGI可能是一種完全不同的智能形式。無論如何，這個(gè)標(biāo)準(zhǔn)的提出至少讓AGI的話題從玄學(xué)回到了可以具體討論的問題上。這比空談AGI的到來更有意義。AI進(jìn)化的速度比你想象的還慢 AGI仍遙不可及！

(責(zé)任編輯：0882)

關(guān)閉

AI進(jìn)化的速度比你想象的還慢 AGI仍遙不可及

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)