OpenAI新模型草莓將接近博士水平認(rèn)知躍升，挑戰(zhàn)復(fù)雜推理

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-09-13 10:51:00 每日經(jīng)濟(jì)新聞

在周五凌晨1點(diǎn)左右，AI領(lǐng)域邁入了一個新紀(jì)元，隨著能夠執(zhí)行復(fù)雜推理任務(wù)的大規(guī)模模型的面世。OpenAI官方宣布，向其訂閱用戶正式推出OpenAI o1預(yù)覽模型，這一備受矚目的模型被稱為“草莓”大模型。OpenAI強(qiáng)調(diào)，這款新模型在處理復(fù)雜推理任務(wù)上達(dá)到了人工智能的新高度，因此它被賦予了一個區(qū)別于“GPT-4”系列的獨(dú)有命名，標(biāo)志著技術(shù)的重新計(jì)數(shù)與革新。

與以往模型依賴于學(xué)習(xí)數(shù)據(jù)模式來預(yù)測文本生成不同，o1模型在回答問題前會進(jìn)行深入的思考，模擬人類的思考過程。當(dāng)前，OpenAI僅釋出了o1-preview和o1-mini兩個版本，并逐步向不同類型的用戶群體推廣，值得注意的是，開發(fā)者使用該模型的成本相對較高。

據(jù)透露，o1模型的訓(xùn)練方式有了根本性變革，使其能夠高效解決編程、數(shù)學(xué)及科學(xué)難題，并以超乎人類的速度提供經(jīng)過深思熟慮的答案。o1-mini版則專注于編程應(yīng)用，更為精簡。從即時起，ChatGPT Plus和Team的付費(fèi)用戶可選擇體驗(yàn)這兩個模型，而Enterprise和Edu用戶需等待至下周。未來，免費(fèi)用戶也將有機(jī)會接觸o1-mini。OpenAI正探索自動為用戶提供最適合模型的方法。

然而，對于開發(fā)者而言，o1模型的使用成本高昂，其API費(fèi)用相比GPT-4o提升了三到四倍，每百萬個輸入或輸出token的費(fèi)用分別達(dá)到15美元和60美元，這反映了處理大規(guī)模文本的高成本。

OpenAI的研究負(fù)責(zé)人Jerry Tworek揭示了o1模型訓(xùn)練方式的根本變化：它采用了新的優(yōu)化算法和定制的數(shù)據(jù)集，包含“推理數(shù)據(jù)”及特選的科學(xué)文獻(xiàn)。此外，o1放棄了傳統(tǒng)模仿模式的訓(xùn)練方法，轉(zhuǎn)而采取“強(qiáng)化學(xué)習(xí)”，通過獎勵和懲罰機(jī)制引導(dǎo)模型自我解決問題，并通過“思路鏈”進(jìn)行問題處理，類似于人類的邏輯推理過程。這一創(chuàng)新旨在提升模型的準(zhǔn)確性，減少不實(shí)回答，盡管還不能完全避免“幻覺”現(xiàn)象。

OpenAI視o1模型為實(shí)現(xiàn)AI從“高中生”到“理科博士生”智能飛躍的關(guān)鍵步驟，它在解決復(fù)雜推理問題上的能力超越了現(xiàn)有的大模型，并能有效改進(jìn)機(jī)制性缺陷。例如，o1模型能夠精確計(jì)算單詞中的字母數(shù)量，或在編程問題中展現(xiàn)出更系統(tǒng)化的解題思路，通過不斷試錯優(yōu)化答案，提高了生成內(nèi)容的準(zhǔn)確性和質(zhì)量。

盡管如此，o1預(yù)覽版仍存在一些限制，如無法瀏覽實(shí)時網(wǎng)頁、上傳文件或圖片，以及在某些領(lǐng)域的知識掌握上不如GPT-4o全面。此外，它在處理某些問題時速度較慢，且由于是純文本模型，缺乏動態(tài)信息處理能力。OpenAI也承認(rèn)，新模型在某些情況下可能更容易產(chǎn)生“幻覺”，即錯誤地自信給出答案，而不承認(rèn)對問題的無知。為了保持競爭優(yōu)勢，他們選擇在答案中展示思路鏈的摘要而非完整鏈條。

(責(zé)任編輯：張小花 TT1000)

關(guān)閉

OpenAI新模型草莓將接近博士水平 認(rèn)知躍升，挑戰(zhàn)復(fù)雜推理

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

OpenAI新模型草莓將接近博士水平認(rèn)知躍升，挑戰(zhàn)復(fù)雜推理