雖然OpenAI的一些模型也使用了RL技術,性能與DeepSeek-R1相當,但卡帕西表示他大約80%-90%的查詢依然由GPT-4o完成,只有遇到非常困難的代碼和數(shù)學問題時才會使用思考模型。
強化學習是一種強大的學習方式,這一點已在圍棋領域得到驗證。DeepMind開發(fā)的AlphaGo通過自博弈和強化學習突破了人類棋手的實力上限。AlphaGo通過廣泛嘗試制勝策略,甚至超越了頂級玩家李世石。理論上,強化學習可以持續(xù)運行,但由于成本原因,DeepMind團隊選擇在某些時候停止。通過DeepSeek-R1,我們開始看到強化學習在大語言模型推理問題上的巨大潛力。
未來,如果我們繼續(xù)在大語言模型領域擴展強化學習,可能解鎖那些讓人類難以理解的解決方案。這可能包括發(fā)現(xiàn)新的類比、思考策略,甚至是發(fā)明一種更適合思考的語言。實現(xiàn)這些的前提是為模型創(chuàng)造足夠大的問題集,讓其不斷優(yōu)化和完善解決問題的策略。
卡帕西還預言了未來幾大AI趨勢,包括多模態(tài)AI和測試時訓練。由于音頻、圖片、視頻等內容都可以被token化,采用大語言模型的訓練邏輯將提升模型在相關領域的表現(xiàn)。此外,測試時訓練將成為AI研究的前沿方向,允許模型根據(jù)新數(shù)據(jù)微調參數(shù),更好地應對特定問題。
強化學習作為上一個世代AI能力突破的重要方向,由DeepSeek在生成式AI時代再度發(fā)揚光大。盡管有一些質疑聲音,但許多專注于技術本身的AI開發(fā)者認為,DeepSeek的開源突破對整個AI界的發(fā)展是有利的,他們期待DeepSeek帶來更多驚喜。AI大??ㄅ廖魇①滵eepSeek!
最近,社交平臺上涌現(xiàn)出大量關于AI算命的討論。以DeepSeek為代表的AI算命在年輕人中掀起了一股熱潮,成為他們在應對婚戀、職場等壓力時的“救命稻草”
2025-02-16 19:52:04DeepSeek爆火的啟示2025年將是AI商業(yè)化落地的重要一年,智能手機行業(yè)的競爭尤為激烈。蘋果CEO庫克曾表示,在已開放使用Apple Intelligence技術的國家內,iPhone 16系列銷量更高
2025-02-25 21:09:04分析我們需要更多的DeepSeek。過去幾年里,中國大模型從業(yè)者們經(jīng)常被問及中國距離追上ChatGPT還有多遠。2025年初,這個問題有了新的答案
2025-02-21 17:49:36DeepSeek爆火