中國(guó)2家公司發(fā)新模型趕超OpenAI!在美國(guó)知名技術(shù)社區(qū)Hacker News上,一位開發(fā)者感嘆中國(guó)實(shí)驗(yàn)室在人工智能領(lǐng)域的追趕速度令人難以置信。有外媒報(bào)道也指出,中國(guó)初創(chuàng)公司在AI模型研發(fā)方面表現(xiàn)出趕超美國(guó)的跡象,且進(jìn)展速度超出預(yù)期。
1月20日,國(guó)內(nèi)兩家備受關(guān)注的人工智能大模型創(chuàng)業(yè)公司月之暗面和深度求索幾乎同時(shí)發(fā)布了最新模型,性能測(cè)試均超過(guò)OpenAI的o1正式版模型。月之暗面發(fā)布的k1.5多模態(tài)思考模型在數(shù)學(xué)、代碼、視覺多模態(tài)和通用能力方面大幅超越了GPT-4o和Claude 3.5 Sonnet等全球領(lǐng)先的短思考模型,領(lǐng)先幅度達(dá)到550%。而在長(zhǎng)思考模式下,該模型的性能也達(dá)到了OpenAI o1正式版的水平。
深度求索發(fā)布的DeepSeek-R1通過(guò)大規(guī)模使用強(qiáng)化學(xué)習(xí)技術(shù),在僅有少量標(biāo)注數(shù)據(jù)的情況下顯著提升了模型推理能力。其在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上的表現(xiàn)與OpenAI o1正式版相當(dāng)。這兩家國(guó)產(chǎn)模型不僅實(shí)現(xiàn)了對(duì)標(biāo)甚至超越OpenAI o1正式版,還公開了技術(shù)報(bào)告,展示了各自的創(chuàng)新點(diǎn)。Kimi k1.5采用了原創(chuàng)技術(shù)long2short,結(jié)合高效思維鏈和原生多模態(tài);DeepSeek R1則以高性價(jià)比為特點(diǎn)。
這些報(bào)告引起了海外從業(yè)者的廣泛關(guān)注。英偉達(dá)高級(jí)科學(xué)家范麟熙表示,兩篇論文披露的技術(shù)細(xì)節(jié)令人鼓舞。Answera公司創(chuàng)始人保羅·庫(kù)弗特也認(rèn)為,中國(guó)AI追趕速度越來(lái)越快。中央民族大學(xué)教授郭全中評(píng)論稱,中國(guó)AI公司正在走向自主創(chuàng)新的新階段,期待更多中國(guó)企業(yè)在全球AI舞臺(tái)上展現(xiàn)實(shí)力。
ChatGPT面市兩周年前夕,有消息稱OpenAI計(jì)劃推出下一代前沿旗艦?zāi)P蚈rion
2024-10-26 00:11:04奧爾特曼辟謠OpenAI新模型消息