在周五凌晨1點(diǎn)左右,AI領(lǐng)域邁入了一個新紀(jì)元,隨著能夠執(zhí)行復(fù)雜推理任務(wù)的大規(guī)模模型的面世。OpenAI官方宣布,向其訂閱用戶正式推出OpenAI o1預(yù)覽模型,這一備受矚目的模型被稱為“草莓”大模型。OpenAI強(qiáng)調(diào),這款新模型在處理復(fù)雜推理任務(wù)上達(dá)到了人工智能的新高度,因此它被賦予了一個區(qū)別于“GPT-4”系列的獨(dú)有命名,標(biāo)志著技術(shù)的重新計(jì)數(shù)與革新。
與以往模型依賴于學(xué)習(xí)數(shù)據(jù)模式來預(yù)測文本生成不同,o1模型在回答問題前會進(jìn)行深入的思考,模擬人類的思考過程。當(dāng)前,OpenAI僅釋出了o1-preview和o1-mini兩個版本,并逐步向不同類型的用戶群體推廣,值得注意的是,開發(fā)者使用該模型的成本相對較高。
據(jù)透露,o1模型的訓(xùn)練方式有了根本性變革,使其能夠高效解決編程、數(shù)學(xué)及科學(xué)難題,并以超乎人類的速度提供經(jīng)過深思熟慮的答案。o1-mini版則專注于編程應(yīng)用,更為精簡。從即時起,ChatGPT Plus和Team的付費(fèi)用戶可選擇體驗(yàn)這兩個模型,而Enterprise和Edu用戶需等待至下周。未來,免費(fèi)用戶也將有機(jī)會接觸o1-mini。OpenAI正探索自動為用戶提供最適合模型的方法。
然而,對于開發(fā)者而言,o1模型的使用成本高昂,其API費(fèi)用相比GPT-4o提升了三到四倍,每百萬個輸入或輸出token的費(fèi)用分別達(dá)到15美元和60美元,這反映了處理大規(guī)模文本的高成本。
OpenAI的研究負(fù)責(zé)人Jerry Tworek揭示了o1模型訓(xùn)練方式的根本變化:它采用了新的優(yōu)化算法和定制的數(shù)據(jù)集,包含“推理數(shù)據(jù)”及特選的科學(xué)文獻(xiàn)。此外,o1放棄了傳統(tǒng)模仿模式的訓(xùn)練方法,轉(zhuǎn)而采取“強(qiáng)化學(xué)習(xí)”,通過獎勵和懲罰機(jī)制引導(dǎo)模型自我解決問題,并通過“思路鏈”進(jìn)行問題處理,類似于人類的邏輯推理過程。這一創(chuàng)新旨在提升模型的準(zhǔn)確性,減少不實(shí)回答,盡管還不能完全避免“幻覺”現(xiàn)象。
OpenAI視o1模型為實(shí)現(xiàn)AI從“高中生”到“理科博士生”智能飛躍的關(guān)鍵步驟,它在解決復(fù)雜推理問題上的能力超越了現(xiàn)有的大模型,并能有效改進(jìn)機(jī)制性缺陷。例如,o1模型能夠精確計(jì)算單詞中的字母數(shù)量,或在編程問題中展現(xiàn)出更系統(tǒng)化的解題思路,通過不斷試錯優(yōu)化答案,提高了生成內(nèi)容的準(zhǔn)確性和質(zhì)量。
盡管如此,o1預(yù)覽版仍存在一些限制,如無法瀏覽實(shí)時網(wǎng)頁、上傳文件或圖片,以及在某些領(lǐng)域的知識掌握上不如GPT-4o全面。此外,它在處理某些問題時速度較慢,且由于是純文本模型,缺乏動態(tài)信息處理能力。OpenAI也承認(rèn),新模型在某些情況下可能更容易產(chǎn)生“幻覺”,即錯誤地自信給出答案,而不承認(rèn)對問題的無知。為了保持競爭優(yōu)勢,他們選擇在答案中展示思路鏈的摘要而非完整鏈條。
在周二凌晨1點(diǎn)的春季發(fā)布會上,OpenAI繼“文生視頻模型”Sora后再次為市場帶來新驚喜
2024-05-14 09:07:05OpenAI新模型:圖文音頻全搞定