為什么說GPT-4o并不驚艷？多維度測試揭示局限性

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-05-16 15:57:44 金融界

為什么說GPT-4o并不驚艷？

5月14日凌晨，OpenAI推出了GPT-4o，這款新模型集成了聽覺、視覺與語言處理能力，能夠?qū)崟r分析音頻、視覺及文本信息，并以任意組合方式輸出文本、音頻或圖像內(nèi)容。在演示中，GPT-4o展現(xiàn)了高度的人情味，它能感知對話者的情緒并給予適時的安慰與建議，其互動宛如與老友交談，引發(fā)網(wǎng)友對人工智能視覺功能及其潛在應(yīng)用，如輔助視障人士的討論。

為了深入評估GPT-4o的性能，一系列測試被開展。在文本創(chuàng)作上，它迅速且準確地完成了從編寫中國神話故事到解析公司財報的任務(wù)，甚至能快速識別財報中的關(guān)鍵數(shù)據(jù)和潛在風(fēng)險。盡管在處理復(fù)雜翻譯任務(wù)時速度稍有下降，但依舊能高效提取核心信息。不過，發(fā)布會提及的跨模態(tài)內(nèi)容生成功能目前尚未實現(xiàn)，GPT-4o尚不能直接創(chuàng)建含圖片和音頻的文檔。

在問答能力上，GPT-4o轉(zhuǎn)變?yōu)樘峁┫嚓P(guān)網(wǎng)頁鏈接，顯示出向AI搜索引擎發(fā)展的趨勢，這與行業(yè)觀察者的預(yù)測相符。圖像識別方面，它在處理特定情境時表現(xiàn)出色，但在理解新興文化現(xiàn)象時有所欠缺，突顯了持續(xù)學(xué)習(xí)的重要性，尤其是對多元文化的深入理解。

至于圖像生成，GPT-4o的表現(xiàn)參差不齊，雖然能在某些場景下準確描述人物情感，卻在傳統(tǒng)文化知識上出現(xiàn)誤解，如錯誤描繪中國傳統(tǒng)神話中的青龍形象。視頻識別與處理能力也未達到預(yù)期，無法直接處理音頻或視頻內(nèi)容。為什么說GPT-4o并不驚艷？

在邏輯推理和特定領(lǐng)域知識測試上，如解答高難度數(shù)學(xué)題時，GPT-4o的解題能力和準確性不盡人意，反映了其在高度專業(yè)和邏輯嚴密性任務(wù)上的局限。

對于GPT-4o的未來展望，雖然OpenAI的高層對其潛力充滿期待，但實際測試結(jié)果顯示，它距離徹底顛覆性的革新還有一定距離。同時，中美大模型之間的差距以及國內(nèi)市場對軟件付費的態(tài)度，都意味著國內(nèi)大模型在商業(yè)化道路上還需經(jīng)歷長期探索與努力。國內(nèi)廠商面對的不僅是技術(shù)追趕，還有商業(yè)模式的創(chuàng)新，這條發(fā)展之路無疑充滿了挑戰(zhàn)。

(責任編輯：盧其龍 CN070)

關(guān)閉

為什么說GPT-4o并不驚艷？ 多維度測試揭示局限性

相關(guān)新聞

今日熱點

頻道熱點

為什么說GPT-4o并不驚艷？多維度測試揭示局限性