AI進(jìn)化的速度比你想象的還慢 AGI仍遙不可及!關(guān)于AI何時(shí)能超越人類的問題,業(yè)界普遍認(rèn)為實(shí)現(xiàn)AGI(通用人工智能)是關(guān)鍵。簡單來說,就是創(chuàng)造出和人一樣聰明的AI。比如馬斯克和OpenAI的奧特曼都頻繁提到AGI即將到來。
然而,如何衡量AGI的水平卻是個(gè)難題。人的智力差異巨大,難以用單一標(biāo)準(zhǔn)來衡量。即使是那些經(jīng)常討論AGI的大佬們也難以給出明確的定義。
最近,一群頂尖專家聯(lián)合發(fā)表了一篇論文,給出了首個(gè)AGI的量化定義。他們認(rèn)為AGI應(yīng)該達(dá)到一個(gè)受過良好教育的成年人的能力。為此,他們引入了心理學(xué)中的CHC理論,將AI的能力分為十個(gè)核心維度,每個(gè)占10%的分值:通識(shí)知識(shí)、讀寫能力、數(shù)學(xué)能力、即時(shí)推理、工作記憶、視覺處理、聽覺處理、反應(yīng)速度、長期記憶存儲(chǔ)和長期記憶檢索。
工作記憶指的是短期記憶,而長期記憶則是指AI通過對話永久性學(xué)到新東西。每種能力都有專門的測試題。例如,在即時(shí)推理方面,他們會(huì)提出一些燒腦的問題來測試AI的能力。
研究團(tuán)隊(duì)用GPT-4和GPT-5進(jìn)行了測試。結(jié)果顯示,GPT-4總分27,GPT-5總分58,均未達(dá)到滿分。具體來看,GPT-5在通識(shí)知識(shí)、讀寫能力和數(shù)學(xué)能力上表現(xiàn)較好,但在長期記憶存儲(chǔ)和長期記憶檢索方面得分很低。這說明目前的AI在持續(xù)學(xué)習(xí)和記憶方面存在嚴(yán)重缺陷。
此外,視覺處理也是AI的一大短板。GPT-4得分為零,GPT-5也只有4分。視覺推理對大模型來說非常困難,例如識(shí)別哪些2D展開圖不能折成立方體這樣的問題。
盡管這份報(bào)告并不完美,但它為當(dāng)前的AI提供了一次全面診斷,揭示了AI在一些基本認(rèn)知能力上的缺陷。同時(shí),它也提醒人們,通過捷徑掩蓋弱點(diǎn)的AI無法真正實(shí)現(xiàn)AGI。
有人質(zhì)疑這種標(biāo)準(zhǔn)是否合理,認(rèn)為AGI可能是一種完全不同的智能形式。無論如何,這個(gè)標(biāo)準(zhǔn)的提出至少讓AGI的話題從玄學(xué)回到了可以具體討論的問題上。這比空談AGI的到來更有意義。AI進(jìn)化的速度比你想象的還慢 AGI仍遙不可及!
華為在6月20日召開的開發(fā)者大會(huì)上公布了鴻蒙系統(tǒng)的最新進(jìn)展
2025-06-20 22:42:31鴻蒙實(shí)力詮釋AIOS