DeepSeek和李飛飛之后，英偉達(dá)也看上阿里千問？千問潛力引關(guān)注

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-05-13 15:51:00 新浪財(cái)經(jīng)

DeepSeek和李飛飛之后，英偉達(dá)也看上阿里千問？千問潛力引關(guān)注！在全球開源大模型生態(tài)圈中，阿里無(wú)疑是備受矚目的存在。上周，繼DeepSeek和“AI教母”李飛飛之后，英偉達(dá)也選擇了與阿里合作。在最新的“混合推理模型”千問3宣布開源當(dāng)日，英偉達(dá)迅速接入適配，并于5月9日開源了全新的代碼推理模型Open Code Reasoning（簡(jiǎn)稱OCR），包括7B、14B、32B三種尺寸，基礎(chǔ)模型均基于通義千問。

在LiveCodeBench評(píng)測(cè)中，英偉達(dá)的OCR-Qwen-32B-Instruct模型成功超越了Open AI公司的o3-mini和o1模型，該模型正是基于Qwen2.5-32B微調(diào)形成的。盡管通義千問已迭代至3.0版本，性能再度突破，但英偉達(dá)仍基于上一代千問模型做出了比肩全球一流水平的模型，這讓人不禁好奇千問究竟還有多少隱藏潛力待發(fā)掘。

目前，英偉達(dá)開源的OCR系列模型的代碼及數(shù)據(jù)集已在Hugging Face平臺(tái)上公開分享，供開發(fā)者們免費(fèi)瀏覽學(xué)習(xí)。其中，OCR-Qwen-32B-Instruct在LiveCodeBench的pass1測(cè)試中獲得了61.8%的成績(jī)，超過了OpenAI的O3-Mini-2025-01-31（Low）和O1-2024-12-17（Low）。長(zhǎng)期以來(lái)，人們普遍認(rèn)為閉源模型在能力上遠(yuǎn)超開源模型，但英偉達(dá)此次開源的OCR模型反駁了這一觀點(diǎn)。只要底座模型足夠好，即使不是最新版本的開源模型，在經(jīng)過高質(zhì)量訓(xùn)練和優(yōu)化后，也能超越閉源模型。

此前，斯坦福大學(xué)人工智能研究院院長(zhǎng)李飛飛團(tuán)隊(duì)也曾基于阿里通義千問Qwen2.5-32B-Instruct，訓(xùn)練出與OpenAI o1、DeepSeek R1等尖端推理模型數(shù)學(xué)及編碼能力相當(dāng)?shù)膕1-32B模型。今年4月，李飛飛團(tuán)隊(duì)的研究報(bào)告顯示：中美兩國(guó)模型性能差距由2023年的17.5%大幅縮小至0.3%，近乎持平。阿里的六大模型入選報(bào)告，貢獻(xiàn)度僅次于OpenAI和Google，排名全球第三、中國(guó)第一。

更早之前，DeepSeek官方透露曾將DeepSeek-R1的推理能力蒸餾成六個(gè)模型開源給社區(qū)，其中有四個(gè)來(lái)自千問，且在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)OpenAI o1-mini的效果。不少學(xué)者指出，千問是所有開源模型中“隱藏驚喜”最大的?；F盧大學(xué)陳文虎教授直言，用同樣的方法訓(xùn)練和微調(diào)別的模型都不管用，只有千問才有效果，“千問系列模型一定有一些魔力！”

事實(shí)上，在開源大模型領(lǐng)域，被千問“迷之魅力”吸引來(lái)的不僅有頂級(jí)公司和大佬，還有日常頻繁使用大模型的普通開發(fā)者們。據(jù)公開數(shù)據(jù)顯示，截至當(dāng)前，千問全球下載量超3億；在HuggingFace社區(qū)2024年全球模型下載量中占比超過30%，穩(wěn)居全球第一。千問衍生模型數(shù)量已突破10萬(wàn)，超越美國(guó)Llama模型，成為全球第一AI開源模型。在2025年2月的Huggingface全球開源大模型榜單中，排名前十的開源模型全部基于千問Qwen二次開發(fā)。

一個(gè)來(lái)自中國(guó)的大模型之所以在全球AI社區(qū)引發(fā)狂潮，主要得益于以下三方面的作用。首先，千問性能強(qiáng)勁且成本更低。每次新發(fā)布幾乎都刷新了開源模型的上限，例如最近的千問3在AIME25測(cè)評(píng)中斬獲81.5分，刷新開源紀(jì)錄；在LiveCodeBench評(píng)測(cè)中突破70分大關(guān)，表現(xiàn)甚至超過Grok3。此外，千問3的部署成本僅為性能相近模型的三分之一，推理成本也不到DeepSeek-R1的三成。

其次，千問提供了豐富的開源選項(xiàng)。阿里通義團(tuán)隊(duì)截至目前共開源了200多款模型，從文本生成模型、視覺理解/生成模型、語(yǔ)音理解/生成模型到文生圖及視頻模型等“全模態(tài)”模型，再到0.5B、1.5B、3B、7B、14B、32B、72B、110B、235B等“全尺寸”模型，幾乎是世界上開源層次最豐富、布局最飽滿的模型家族。千問3提供的119種語(yǔ)言支持，對(duì)全球開發(fā)者特別是小語(yǔ)種地區(qū)的開發(fā)者來(lái)說是一次極大的利好。

最后，千問擁有廣泛的“朋友圈”，圍繞千問打造了強(qiáng)大的開源生態(tài)。國(guó)際開源社區(qū)對(duì)Qwen3的支持非常豐富，覆蓋了主流的開源機(jī)構(gòu)和平臺(tái)。這意味著，千問3一開源，所有開發(fā)者和機(jī)構(gòu)就可直接上手體驗(yàn)，無(wú)需等待配套工具。在產(chǎn)業(yè)界，一大批產(chǎn)業(yè)鏈上下游企業(yè)也宣布適配及接入千問3，包括英特爾、高通、聯(lián)發(fā)科等多家頭部芯片廠商，以及華為昇騰、百度千帆、中科曙光等多家AI公司和大模型服務(wù)平臺(tái)。

千問不僅是全球開源社區(qū)的領(lǐng)頭羊，也是阿里最重要的AI戰(zhàn)略支點(diǎn)。阿里巴巴集團(tuán)CEO吳泳銘宣布，未來(lái)三年將投入超過3800億元用于建設(shè)云和人工智能硬件基礎(chǔ)設(shè)施，這是中國(guó)民營(yíng)企業(yè)在云和AI硬件基礎(chǔ)設(shè)施建設(shè)領(lǐng)域的最大規(guī)模投資。阿里巴巴董事長(zhǎng)蔡崇信也強(qiáng)調(diào)，阿里要把AI融入每一塊業(yè)務(wù)、每一個(gè)環(huán)節(jié)，未來(lái)三到五年，所有業(yè)務(wù)都應(yīng)以AI為驅(qū)動(dòng)。

全新開源的千問3在Agent能力樹方面達(dá)到了頂級(jí)水平，在評(píng)估模型Agent能力的BFCL評(píng)測(cè)中創(chuàng)下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等頂尖模型。同時(shí)，千問3原生支持MCP協(xié)議，并具備強(qiáng)大的工具調(diào)用能力，結(jié)合封裝了工具調(diào)用模板和解析器的Qwen-Agent框架，將大大降低編碼復(fù)雜性，實(shí)現(xiàn)高效的手機(jī)及電腦Agent操作等任務(wù)。

阿里云百煉上線業(yè)界首個(gè)全生命周期MCP服務(wù)，滿足不同場(chǎng)景的Agent應(yīng)用開發(fā)需求。阿里云牽頭的中國(guó)第一AI開源社區(qū)魔搭推出了全新的MCP廣場(chǎng)，通過開源開放的方式加速Agent及AI應(yīng)用的創(chuàng)新和落地。阿里云還預(yù)告了AI Agent Store的愿景，通過這種創(chuàng)新模式，把阿里巴巴集團(tuán)和生態(tài)伙伴的Agent向外開放，讓各行各業(yè)的人都可以擁有自己專屬的助理。

隨著通義系列大模型的發(fā)展，阿里正撬動(dòng)起一個(gè)更為廣泛的AI落地新未來(lái)。

(責(zé)任編輯：0882)

關(guān)閉

DeepSeek和李飛飛之后，英偉達(dá)也看上阿里千問？ 千問潛力引關(guān)注

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

DeepSeek和李飛飛之后，英偉達(dá)也看上阿里千問？千問潛力引關(guān)注