春節(jié)期間,中國(guó)的大模型技術(shù)迎來(lái)了一波密集更新。阿里云通義千問(wèn)超大規(guī)模的MoE模型Qwen2.5-Max正式上線,預(yù)訓(xùn)練數(shù)據(jù)超過(guò)20萬(wàn)億tokens,在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于DeepSeek V3、Llama-3.1-405B以及閉源模型GPT-4o。新模型發(fā)布后,阿里巴巴美股大漲6.76%。此前一天,通義千問(wèn)還開(kāi)源了全新的視覺(jué)模型Qwen2.5-VL,推出3B、7B和72B三個(gè)尺寸版本,能夠更準(zhǔn)確地解析圖像內(nèi)容,支持超1小時(shí)的視頻理解,實(shí)現(xiàn)給指定朋友送祝福、電腦修圖、手機(jī)訂票等操作。
同樣在1月28日,DeepSeek團(tuán)隊(duì)發(fā)布了兩款多模態(tài)框架——Janus-Pro和JanusFlow。其中,Janus-Pro是統(tǒng)一多模態(tài)理解與生成的創(chuàng)新框架,其在圖像生成基準(zhǔn)測(cè)試中的表現(xiàn)超越了OpenAI的“文生圖”模型DALL·E 3,并選擇了開(kāi)源。
目前,國(guó)內(nèi)外廠商在開(kāi)閉源路線上各有側(cè)重。例如,OpenAI的GPT-4模型采用閉源模式,而Meta選擇完全開(kāi)源。其他大模型公司則將低參數(shù)量的模型開(kāi)源,高參數(shù)量的模型閉源。DeepSeek和阿里云通義團(tuán)隊(duì)都是開(kāi)源路線的堅(jiān)持者,此次DeepSeek的成功也被認(rèn)為是開(kāi)源模型的勝利。
Meta首席人工智能科學(xué)家Yann LeCun表示,DeepSeek之所以一鳴驚人,是因?yàn)樗麄儚拈_(kāi)放研究和開(kāi)源中獲益。他們的工作是公開(kāi)發(fā)布和開(kāi)源的,每個(gè)人都可以從中受益,這就是開(kāi)放研究和開(kāi)源的力量。一位大模型青年學(xué)者也認(rèn)為,開(kāi)源和閉源路線各有特色,但開(kāi)源更能促進(jìn)行業(yè)發(fā)展。云基礎(chǔ)設(shè)施廠商有望受益于這次開(kāi)源的勝利,這也是阿里云通義大模型堅(jiān)持開(kāi)源路線的原因之一。
除了基礎(chǔ)模型的更新,各色AI應(yīng)用也成為廠商比拼的焦點(diǎn)。百度智能云曦靈數(shù)字人推出了“飛帖賀新春”微信小程序功能,用戶上傳一張自己的照片即可快速生成數(shù)字人拜年視頻。阿里云作為央視春晚云計(jì)算AI獨(dú)家合作伙伴,為春晚直播提供了云基礎(chǔ)設(shè)施和通義大模型AI技術(shù)支持,利用通義萬(wàn)相的AI生成能力制作了《在歲月里的花》、《方的言》、《難忘今宵》等歌曲的舞美畫(huà)面。宇樹(shù)科技的人形機(jī)器人H1也在春晚上表演扭秧歌,展示了AI驅(qū)動(dòng)全身運(yùn)動(dòng)控制技術(shù)。今年央視第四次開(kāi)展8K春晚直播,“8K超高清+三維菁彩聲”公共信號(hào)全部采用國(guó)產(chǎn)裝備完成制作,科創(chuàng)板上市公司當(dāng)虹科技為其提供了技術(shù)支持,通過(guò)“百城千屏”超高清傳播平臺(tái),把8K畫(huà)面呈現(xiàn)在全國(guó)上百個(gè)城市、近千塊公共大屏上。
中國(guó)國(guó)產(chǎn)大模型Deepseek在硅谷引起了轟動(dòng)。從斯坦福到麻省理工,Deepseek R1幾乎一夜之間成為美國(guó)頂尖大學(xué)研究人員的首選模型
2025-01-27 15:33:19媒體揭秘國(guó)產(chǎn)大模型DeepSeek