更早之前,DeepSeek官方透露曾將DeepSeek-R1的推理能力蒸餾成六個模型開源給社區(qū),其中有四個來自千問,且在多項能力上實現(xiàn)了對標OpenAI o1-mini的效果。不少學者指出,千問是所有開源模型中“隱藏驚喜”最大的?;F盧大學陳文虎教授直言,用同樣的方法訓練和微調(diào)別的模型都不管用,只有千問才有效果,“千問系列模型一定有一些魔力!”
事實上,在開源大模型領域,被千問“迷之魅力”吸引來的不僅有頂級公司和大佬,還有日常頻繁使用大模型的普通開發(fā)者們。據(jù)公開數(shù)據(jù)顯示,截至當前,千問全球下載量超3億;在HuggingFace社區(qū)2024年全球模型下載量中占比超過30%,穩(wěn)居全球第一。千問衍生模型數(shù)量已突破10萬,超越美國Llama模型,成為全球第一AI開源模型。在2025年2月的Huggingface全球開源大模型榜單中,排名前十的開源模型全部基于千問Qwen二次開發(fā)。
一個來自中國的大模型之所以在全球AI社區(qū)引發(fā)狂潮,主要得益于以下三方面的作用。首先,千問性能強勁且成本更低。每次新發(fā)布幾乎都刷新了開源模型的上限,例如最近的千問3在AIME25測評中斬獲81.5分,刷新開源紀錄;在LiveCodeBench評測中突破70分大關,表現(xiàn)甚至超過Grok3。此外,千問3的部署成本僅為性能相近模型的三分之一,推理成本也不到DeepSeek-R1的三成。
其次,千問提供了豐富的開源選項。阿里通義團隊截至目前共開源了200多款模型,從文本生成模型、視覺理解/生成模型、語音理解/生成模型到文生圖及視頻模型等“全模態(tài)”模型,再到0.5B、1.5B、3B、7B、14B、32B、72B、110B、235B等“全尺寸”模型,幾乎是世界上開源層次最豐富、布局最飽滿的模型家族。千問3提供的119種語言支持,對全球開發(fā)者特別是小語種地區(qū)的開發(fā)者來說是一次極大的利好。
2025年伊始,中國迎來了自己的ChatGPT時刻。DeepSeek-R1模型以其卓越的能力引起了全球關注,從硅谷到中國、從老人到小孩,各行各業(yè)的人都在使用DeepSeek
2025-02-18 09:48:48人均DeepSeek之后AI應用還能怎么做