GPT-5發(fā)布 基準圖錯誤遭吐槽 面向所有用戶開放!當?shù)貢r間8月7日,OpenAI宣布推出新一代旗艦人工智能模型GPT-5,并稱其為“世界上最好的模型”,將免費提供給用戶。該模型面向所有用戶開放,包括免費用戶、Plus用戶、Pro用戶和團隊用戶。下周還將向企業(yè)用戶和教育用戶推出。
OpenAI表示,GPT-5的智能性能遠超公司之前的所有模型,在編碼、數(shù)學、寫作、健康、視覺感知等領(lǐng)域均表現(xiàn)出色。新模型在響應(yīng)速度、回答準確性以及減少“幻覺”方面都有顯著提升。ChatGPT團隊負責人Nick Turley指出,與前代產(chǎn)品相比,GPT-5讓用戶感覺更自然。
OpenAI首席執(zhí)行官Sam Altman對GPT-5給予了極高評價,認為這是該公司朝通用人工智能目標邁出的重要一步。他表示,無論是顯而易見的還是微妙的,GPT-5都給人更好的體驗,感覺像是在與任何領(lǐng)域的專家交談——一位博士級別的專家。
GPT-5在編程能力方面尤為突出,能夠僅憑一個提示就創(chuàng)建美觀響應(yīng)式的網(wǎng)站、應(yīng)用程序和游戲。在SWE-bench Verified基準測試中,GPT-5首次嘗試的準確率達74.9%,高于其他競爭模型。此外,GPT-5在創(chuàng)意寫作和健康咨詢方面也有所提升,能夠處理復(fù)雜的寫作任務(wù),并更積極地標記潛在健康問題。
OpenAI還引入了一種新的安全訓(xùn)練形式,稱為“安全補全”。這種訓(xùn)練方法教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。GPT-5經(jīng)過訓(xùn)練后能夠識別任務(wù)何時無法完成,避免猜測,并能更清晰地解釋局限性,從而減少了無根據(jù)的斷言。
此外,OpenAI還為ChatGPT用戶推出了四種預(yù)設(shè)性格:憤世嫉俗者、機器人、傾聽者和書呆子。這些性格選項適用于文本聊天,未來還將擴展到語音聊天,使用戶無需編寫自定義提示詞即可設(shè)置ChatGPT的交互方式。
然而,在GPT-5的發(fā)布會上出現(xiàn)了一些小錯誤,如現(xiàn)場展示的性能圖表存在數(shù)據(jù)與圖表顯示不匹配的情況。特斯拉CEO馬斯克也在社交媒體上指出了GPT-5在某些基準測試中的表現(xiàn)不如預(yù)期。
微軟計劃將OpenAI的GPT-5整合到其Copilot生態(tài)系統(tǒng)中,包括Microsoft 365 Copilot、GitHub Copilot、Azure AI Foundry和Copilot Studio。新的智能模式支持動態(tài)模型切換,以增強推理和特定任務(wù)的響應(yīng)。開發(fā)人員可以通過Azure AI Foundry利用GPT-5,確保AI驅(qū)動的應(yīng)用程序中特定于任務(wù)的精度。
等了多年的 GPT-5 終于在一個凌晨發(fā)布了。直播中,OpenAI 的幾位核心人員顯得非常緊張,奧特曼在直播過程中連發(fā)十幾條推特介紹 GPT-5 的特點
2025-08-08 07:55:42GPT-5基準圖錯誤遭全網(wǎng)吐槽山姆因好麗友派等新品被網(wǎng)友質(zhì)疑選品標準,引發(fā)熱議。這場爭議源于山姆近期密集的商品調(diào)整
2025-07-17 10:30:43山姆遭會員集體吐槽網(wǎng)友表示:“給我一個不買16的理由”?時隔三年,平價iPhone終于迎來更新。此前被頻繁爆料的iPhone SE4最終變成了iPhone 16系列的新成員——iPhone 16e
2025-02-20 16:06:25最便宜蘋果AI手機遭吐槽