美國(guó)科技巨頭Meta于4月5日推出了其最強(qiáng)大的開源人工智能模型Llama 4,該模型有兩個(gè)版本,分別名為Scout和Maverick。Llama 4是一個(gè)多模態(tài)大模型,能夠處理和整合文本、視頻、圖像和音頻等不同類型的數(shù)據(jù),并在這些格式之間轉(zhuǎn)換內(nèi)容。
Llama 4系列首次采用了混合專家(MoE)架構(gòu),這種架構(gòu)可以將模型劃分為多個(gè)專注于特定任務(wù)的“專家”子模型,從而提高訓(xùn)練和回答用戶查詢時(shí)的效率。據(jù)Meta介紹,Scout和Maverick不僅是其迄今為止最先進(jìn)的模型,也是多模態(tài)領(lǐng)域中最先進(jìn)的模型之一。Scout擁有170億個(gè)活躍參數(shù)、16個(gè)“專家”模型、總參數(shù)量為1090億;而Maverick同樣有170億個(gè)活躍參數(shù),但配備了128個(gè)“專家”模型,總參數(shù)量高達(dá)4000億。
除了Scout和Maverick之外,Meta還在開發(fā)一個(gè)功能更加強(qiáng)大的模型Behemoth,稱其為世界上最智能的大模型之一,是新模型中的教師。所有這些模型都經(jīng)過(guò)了大量未標(biāo)注的文本、圖像和視頻數(shù)據(jù)的訓(xùn)練,以獲得廣泛的視覺(jué)理解能力。Scout和Maverick模型可以在Llama.com網(wǎng)站以及Meta的合作伙伴處公開獲取,同時(shí)也可以在WhatsApp、Messenger、Instagram Direct上使用。
Meta表示,其人工智能助手Meta AI已在40個(gè)國(guó)家更新為使用Llama 4模型,目前多模態(tài)功能僅在美國(guó)以英語(yǔ)提供。公司首席執(zhí)行官扎克伯格強(qiáng)調(diào),目標(biāo)是建立世界領(lǐng)先的人工智能,將其開源并普及,讓每個(gè)人都能從中受益。他認(rèn)為開源人工智能將成為領(lǐng)先的模型,隨著Llama 4的推出,這一愿景正在逐步實(shí)現(xiàn)。此外,Meta首席產(chǎn)品官Chris Cox提到,Llama 4的推出將使AI智能體變得更強(qiáng)大,具備更高水平的推理和行動(dòng)能力。
此前,Llama 3已經(jīng)推出一年,Llama 4之所以遲遲未能發(fā)布,是因?yàn)樵陂_發(fā)過(guò)程中遇到了技術(shù)上的挑戰(zhàn),特別是在推理和數(shù)學(xué)任務(wù)方面沒(méi)有達(dá)到預(yù)期。此外,Meta也擔(dān)心其模型在模擬人類語(yǔ)音對(duì)話方面不如競(jìng)爭(zhēng)對(duì)手OpenAI的模型。盡管如此,Meta計(jì)劃今年投入高達(dá)650億美元擴(kuò)大其人工智能基礎(chǔ)設(shè)施,但仍面臨來(lái)自投資者的壓力,要求展示投資的實(shí)際回報(bào)。