DeepSeek和李飛飛之后,英偉達(dá)也看上阿里千問? 千問潛力引關(guān)注!在全球開源大模型生態(tài)圈中,阿里無(wú)疑是備受矚目的存在。上周,繼DeepSeek和“AI教母”李飛飛之后,英偉達(dá)也選擇了與阿里合作。在最新的“混合推理模型”千問3宣布開源當(dāng)日,英偉達(dá)迅速接入適配,并于5月9日開源了全新的代碼推理模型Open Code Reasoning(簡(jiǎn)稱OCR),包括7B、14B、32B三種尺寸,基礎(chǔ)模型均基于通義千問。
在LiveCodeBench評(píng)測(cè)中,英偉達(dá)的OCR-Qwen-32B-Instruct模型成功超越了Open AI公司的o3-mini和o1模型,該模型正是基于Qwen2.5-32B微調(diào)形成的。盡管通義千問已迭代至3.0版本,性能再度突破,但英偉達(dá)仍基于上一代千問模型做出了比肩全球一流水平的模型,這讓人不禁好奇千問究竟還有多少隱藏潛力待發(fā)掘。
目前,英偉達(dá)開源的OCR系列模型的代碼及數(shù)據(jù)集已在Hugging Face平臺(tái)上公開分享,供開發(fā)者們免費(fèi)瀏覽學(xué)習(xí)。其中,OCR-Qwen-32B-Instruct在LiveCodeBench的pass1測(cè)試中獲得了61.8%的成績(jī),超過了OpenAI的O3-Mini-2025-01-31(Low)和O1-2024-12-17(Low)。長(zhǎng)期以來(lái),人們普遍認(rèn)為閉源模型在能力上遠(yuǎn)超開源模型,但英偉達(dá)此次開源的OCR模型反駁了這一觀點(diǎn)。只要底座模型足夠好,即使不是最新版本的開源模型,在經(jīng)過高質(zhì)量訓(xùn)練和優(yōu)化后,也能超越閉源模型。
此前,斯坦福大學(xué)人工智能研究院院長(zhǎng)李飛飛團(tuán)隊(duì)也曾基于阿里通義千問Qwen2.5-32B-Instruct,訓(xùn)練出與OpenAI o1、DeepSeek R1等尖端推理模型數(shù)學(xué)及編碼能力相當(dāng)?shù)膕1-32B模型。今年4月,李飛飛團(tuán)隊(duì)的研究報(bào)告顯示:中美兩國(guó)模型性能差距由2023年的17.5%大幅縮小至0.3%,近乎持平。阿里的六大模型入選報(bào)告,貢獻(xiàn)度僅次于OpenAI和Google,排名全球第三、中國(guó)第一。
更早之前,DeepSeek官方透露曾將DeepSeek-R1的推理能力蒸餾成六個(gè)模型開源給社區(qū),其中有四個(gè)來(lái)自千問,且在多項(xiàng)能力上實(shí)現(xiàn)了對(duì)標(biāo)OpenAI o1-mini的效果。不少學(xué)者指出,千問是所有開源模型中“隱藏驚喜”最大的?;F盧大學(xué)陳文虎教授直言,用同樣的方法訓(xùn)練和微調(diào)別的模型都不管用,只有千問才有效果,“千問系列模型一定有一些魔力!”
事實(shí)上,在開源大模型領(lǐng)域,被千問“迷之魅力”吸引來(lái)的不僅有頂級(jí)公司和大佬,還有日常頻繁使用大模型的普通開發(fā)者們。據(jù)公開數(shù)據(jù)顯示,截至當(dāng)前,千問全球下載量超3億;在HuggingFace社區(qū)2024年全球模型下載量中占比超過30%,穩(wěn)居全球第一。千問衍生模型數(shù)量已突破10萬(wàn),超越美國(guó)Llama模型,成為全球第一AI開源模型。在2025年2月的Huggingface全球開源大模型榜單中,排名前十的開源模型全部基于千問Qwen二次開發(fā)。
一個(gè)來(lái)自中國(guó)的大模型之所以在全球AI社區(qū)引發(fā)狂潮,主要得益于以下三方面的作用。首先,千問性能強(qiáng)勁且成本更低。每次新發(fā)布幾乎都刷新了開源模型的上限,例如最近的千問3在AIME25測(cè)評(píng)中斬獲81.5分,刷新開源紀(jì)錄;在LiveCodeBench評(píng)測(cè)中突破70分大關(guān),表現(xiàn)甚至超過Grok3。此外,千問3的部署成本僅為性能相近模型的三分之一,推理成本也不到DeepSeek-R1的三成。
其次,千問提供了豐富的開源選項(xiàng)。阿里通義團(tuán)隊(duì)截至目前共開源了200多款模型,從文本生成模型、視覺理解/生成模型、語(yǔ)音理解/生成模型到文生圖及視頻模型等“全模態(tài)”模型,再到0.5B、1.5B、3B、7B、14B、32B、72B、110B、235B等“全尺寸”模型,幾乎是世界上開源層次最豐富、布局最飽滿的模型家族。千問3提供的119種語(yǔ)言支持,對(duì)全球開發(fā)者特別是小語(yǔ)種地區(qū)的開發(fā)者來(lái)說是一次極大的利好。
最后,千問擁有廣泛的“朋友圈”,圍繞千問打造了強(qiáng)大的開源生態(tài)。國(guó)際開源社區(qū)對(duì)Qwen3的支持非常豐富,覆蓋了主流的開源機(jī)構(gòu)和平臺(tái)。這意味著,千問3一開源,所有開發(fā)者和機(jī)構(gòu)就可直接上手體驗(yàn),無(wú)需等待配套工具。在產(chǎn)業(yè)界,一大批產(chǎn)業(yè)鏈上下游企業(yè)也宣布適配及接入千問3,包括英特爾、高通、聯(lián)發(fā)科等多家頭部芯片廠商,以及華為昇騰、百度千帆、中科曙光等多家AI公司和大模型服務(wù)平臺(tái)。
千問不僅是全球開源社區(qū)的領(lǐng)頭羊,也是阿里最重要的AI戰(zhàn)略支點(diǎn)。阿里巴巴集團(tuán)CEO吳泳銘宣布,未來(lái)三年將投入超過3800億元用于建設(shè)云和人工智能硬件基礎(chǔ)設(shè)施,這是中國(guó)民營(yíng)企業(yè)在云和AI硬件基礎(chǔ)設(shè)施建設(shè)領(lǐng)域的最大規(guī)模投資。阿里巴巴董事長(zhǎng)蔡崇信也強(qiáng)調(diào),阿里要把AI融入每一塊業(yè)務(wù)、每一個(gè)環(huán)節(jié),未來(lái)三到五年,所有業(yè)務(wù)都應(yīng)以AI為驅(qū)動(dòng)。
全新開源的千問3在Agent能力樹方面達(dá)到了頂級(jí)水平,在評(píng)估模型Agent能力的BFCL評(píng)測(cè)中創(chuàng)下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等頂尖模型。同時(shí),千問3原生支持MCP協(xié)議,并具備強(qiáng)大的工具調(diào)用能力,結(jié)合封裝了工具調(diào)用模板和解析器的Qwen-Agent框架,將大大降低編碼復(fù)雜性,實(shí)現(xiàn)高效的手機(jī)及電腦Agent操作等任務(wù)。
阿里云百煉上線業(yè)界首個(gè)全生命周期MCP服務(wù),滿足不同場(chǎng)景的Agent應(yīng)用開發(fā)需求。阿里云牽頭的中國(guó)第一AI開源社區(qū)魔搭推出了全新的MCP廣場(chǎng),通過開源開放的方式加速Agent及AI應(yīng)用的創(chuàng)新和落地。阿里云還預(yù)告了AI Agent Store的愿景,通過這種創(chuàng)新模式,把阿里巴巴集團(tuán)和生態(tài)伙伴的Agent向外開放,讓各行各業(yè)的人都可以擁有自己專屬的助理。
隨著通義系列大模型的發(fā)展,阿里正撬動(dòng)起一個(gè)更為廣泛的AI落地新未來(lái)。