從性能上看,GPT-4.5在多個方面超過了GPT-4o及其他許多AI模型。例如,在OpenAI的SimpleQA基準測試中,GPT-4.5的表現(xiàn)優(yōu)于GPT-4o和OpenAI的推理模型o1、o3-mini。然而,在編程能力方面,GPT-4.5在SWE-Bench Verified基準測試上的表現(xiàn)與GPT-4o和o3-mini相當,但遜色于OpenAI的deep research和Anthropic的Claude 3.7 Sonnet。在學術(shù)基準測試如AIME和 GPQA上,GPT-4.5的表現(xiàn)也不及領(lǐng)先的AI推理模型,但在數(shù)學和科學相關(guān)問題上仍然處于領(lǐng)先水平。
打造GPT-4.5的過程充滿挑戰(zhàn)。彭博新聞此前報道稱,該模型在公司內(nèi)部被稱為“Orion”,但在去年未能達到OpenAI設定的性能基準。為了解決這些問題,GPT-4.5采用了與其前代模型相同的核心技術(shù),并結(jié)合人類反饋來優(yōu)化回答內(nèi)容。此外,OpenAI還利用從GPT-4.0訓練數(shù)據(jù)中提取的信息來進一步訓練GPT-4.5。分析認為,GPT-4.5的發(fā)布標志著OpenAI時代的一個轉(zhuǎn)折點。未來,OpenAI計劃在今年晚些時候發(fā)布GPT-5,將把GPT系列模型與o系列模型結(jié)合,構(gòu)建能夠自主判斷需要思考多久再生成回答的AI系統(tǒng)。目前,OpenAI正在與軟銀及其他投資者洽談融資,計劃籌集高達400億美元,使其估值達到3000億美元。與此同時,Anthropic也在進行一輪約35億美元的融資,估值超過600億美元。
OpenAI在“雙十二”第一天宣布了重大更新,推出了最強推理模型o1的滿血版及其Pro版本。同時,ChatGPT也推出了每月200美元的Pro訂閱計劃,成為“世界最貴的大模型”
2024-12-06 07:37:18OpenAI世界最貴大模型OpenAI首席執(zhí)行官薩姆·奧爾特曼宣布,未來幾個月內(nèi)將推出GPT-5,并在幾周內(nèi)先發(fā)布GPT-4.5。這些新模型將應用于聊天機器人ChatGPT以及API平臺
2025-02-13 08:15:35OpenAI稱GPT5將免費無限使用OpenAI首席執(zhí)行官山姆·奧特曼當?shù)貢r間1月17日在社交媒體平臺X發(fā)文稱,OpenAI已完成新推理AI模型o3 mini版本,將在幾周內(nèi)推出
2025-01-18 11:24:13OpenAI將推出推理AI模型