一覺醒來,我被嚇了一跳,好像傳說中的AGI真的來了。早上6、7點(diǎn),突然有大量自媒體不約而同地發(fā)文宣傳一款名為Manus的AI產(chǎn)品。
不同于其他AI大模型,Manus號稱是全球首款通用Agent,實(shí)力碾壓OpenAI。該產(chǎn)品一經(jīng)發(fā)布,瞬間“引爆”網(wǎng)絡(luò),各種宣傳文章層出不窮,好像AGI真的實(shí)現(xiàn)了。根據(jù)Manus官網(wǎng)和各路自媒體夸張宣傳,這是一款能力極強(qiáng)的通用型AI。相比目前比較熟知的各AI大模型,至少在宣傳上,Manus能夠真正意義上成為個(gè)人數(shù)字助手。
使用傳統(tǒng)AI大模型時(shí),用戶提一個(gè)需求,AI完成一個(gè);再提一個(gè),AI繼續(xù)完成下一個(gè)。而Manus則無需這么繁瑣,用戶提一個(gè)需求后,Manus能夠自動搜索、自動思考下一步,幫助用戶做好分析,甚至還能做出詳細(xì)的表格、PPT等。例如向Manus提供亞馬遜商店某個(gè)月銷售數(shù)據(jù),之后要求它通過可視化全面分析,推薦具體數(shù)據(jù)驅(qū)動策略,將下個(gè)月的銷售額提高10%。Manus可以根據(jù)用戶要求,對數(shù)據(jù)進(jìn)行詳細(xì)分析,然后提供一份報(bào)告給出合理策略。整個(gè)過程都是AI自己完成。
Manus還可以篩選簡歷,從數(shù)十份簡歷中根據(jù)候選人信息對其進(jìn)行排名,從而針對某個(gè)特定崗位選出合適候選人。用戶不需要手動解壓文件、一份份將簡歷上傳。Manus像人類一樣能夠自己解壓縮文件、逐頁瀏覽每一份簡歷,同時(shí)記錄里面的重要信息。最終Manus分析完畢后,會給出自動排名的建議,還會根據(jù)工作經(jīng)驗(yàn)等重要維度,將候選人分為不同等級。如果用戶希望將上述信息生成Excel表格,Manus便會以表格形式展現(xiàn)結(jié)果,并記憶用戶習(xí)慣,下次處理類似任務(wù)時(shí)優(yōu)先使用表格形式呈現(xiàn)。
此外,Manus還能夠幫用戶篩選房產(chǎn)。例如用戶希望在紐約購買房產(chǎn),向Manus提出要求是希望有安全的社區(qū)環(huán)境、低犯罪率、以及優(yōu)質(zhì)的教育資源和不要超預(yù)算等。Manus會將該任務(wù)分解為代辦事項(xiàng)列表,通過網(wǎng)絡(luò)搜索,收集信息,最后整合所有信息,結(jié)合用戶需求,提供詳細(xì)報(bào)告,仿佛化身房地產(chǎn)經(jīng)紀(jì)人。Manus還能夠幫用戶分析股票,比如提供不同公司股票價(jià)格之間的關(guān)系,自主訪問相關(guān)網(wǎng)站,交叉驗(yàn)證數(shù)據(jù)準(zhǔn)確度,最終提供詳細(xì)分析報(bào)告。
另有自媒體演示了使用Manus生成一份介紹小米SU7十頁的PPT。用戶提示詞只有“幫我做一下介紹小米SU7十頁的PPT”這么一句話,隨后Manus便自主收集信息,最終生成了十頁P(yáng)PT。筆者特意以同樣提示詞測試了幾個(gè)大模型,但除了DeepSeek外都無法直接生成PPT文件,只能給出PPT介紹大綱,具體內(nèi)容還需要用戶自己補(bǔ)充。而DeepSeek雖然沒直接生成PPT,卻提供了具體每頁P(yáng)PT所有內(nèi)容,用戶需要做的只是排版和設(shè)計(jì)。
產(chǎn)品官網(wǎng)顯示,Manus在GAIA基準(zhǔn)測試中取得SOTA的成績,該成績大幅超過OpenAI,意味著Manus在解決現(xiàn)實(shí)世界問題方面表現(xiàn)優(yōu)秀。
然而,Manus是否真的如此強(qiáng)大仍有疑點(diǎn)。首先,這種“顛覆性的狂歡”似乎只局限于國內(nèi)。今天早上6、7點(diǎn)起,有大量自媒體發(fā)文宣傳Manus,但是該產(chǎn)品在國外視頻平臺上只有一條視頻,且播放量并不高只有幾千。其次,Manus最先是由自媒體“吹捧”起來的,而非技術(shù)專業(yè)人士。不少自媒體宣稱要么是Manus團(tuán)隊(duì)的朋友,要么是通過人脈聯(lián)系到對方。有網(wǎng)友質(zhì)疑認(rèn)為,凡是先由自媒體炒熱的概念,通常都是炒作。對比DeepSeek來看,當(dāng)初DeepSeek確實(shí)是先由專業(yè)人士各種測試體驗(yàn)后走紅,隨后才是鋪天蓋地的媒體宣傳。
3月3日Manus創(chuàng)始人還曾做客某知名AI播客,為新品預(yù)熱宣傳。大部分自媒體宣傳文章中,Manus的評測絕大部分都是對官方宣傳案例的各種解析,只有少數(shù)媒體提供了非官方案例測評。這雖然有目前Manus是以邀請碼形式進(jìn)行少數(shù)體驗(yàn)的原因,但是其能力具體如何僅靠官方宣傳還遠(yuǎn)遠(yuǎn)不夠,尚有待更多測評。
在大部分自媒體宣傳文章中,都給Manus上了“純中國團(tuán)隊(duì)打造”的情緒價(jià)值。比如“東方破曉”、“今夜的星空屬于China”。但是奇怪的是,Manus官網(wǎng)全部都是英文,官方宣傳視頻中也都是英語配中文字幕,就連官網(wǎng)上提供的聯(lián)系方式也都是X平臺這種海外社交媒體。而且還要使用國外的登陸方式才能注冊。一個(gè)純中國團(tuán)隊(duì)打造的產(chǎn)品,卻以純外語宣傳,這意味著似乎這款通用Agent目標(biāo)用戶是海外市場,但是自媒體宣傳時(shí)卻又強(qiáng)調(diào)“中國造”,處處感覺“擰巴”。
不過不管怎樣,鋪天蓋地的輿論造勢確實(shí)引發(fā)了不少人對Manus的興趣。在自媒體宣傳中,Manus的邀請碼那是一碼難求,但是如果沒有自媒體大力宣傳,恐怕沒多少人知道此事,更別提搶碼;只有宣傳后才會激發(fā)大家探索欲,出現(xiàn)搶碼情況。邀請碼模式是上古移動互聯(lián)網(wǎng)時(shí)期的社交裂變營銷手法。
有網(wǎng)友發(fā)文稱,就此事和百川、mgx相關(guān)人士溝通,分享了幾點(diǎn)觀點(diǎn):Manus的能力是compute use + 虛擬機(jī) + artifacts + 內(nèi)置一批agent的綜合產(chǎn)物。如果不會被模型內(nèi)化,agent是個(gè)個(gè)性化的東西,這個(gè)manus定位有點(diǎn)想做通用領(lǐng)域的bolt.new(bolt.new是專注編程任務(wù)),明顯是完全矛盾,不太可能實(shí)現(xiàn)。唯一可能的就是定位為一個(gè)新入口,未來整合各種agent、compute use能力進(jìn)去,這個(gè)工作量極其的大,更看好聚合mcp的協(xié)議模式整合,除非走這個(gè)路線??赡軙鶤I搜索一樣,是個(gè)新型的通用模式探索,但是比AI搜索門檻高,未必能夠成為大眾能夠快速上手的產(chǎn)物。懂得人受制于局限性可能不屑于用,除非有幾個(gè)爆款的場景,不懂的人不會用,但是會在自媒體裝逼的圈子里火起來。如果真像宣傳所說是通用的agent,那么這些通用能力大概率未來會被大模型內(nèi)化掉。同行競爭主要是coze、dify這類,如果這條路通,這些未來也會推出這種路線。
還有網(wǎng)友透露自己剛受邀參加了Manus內(nèi)部發(fā)布會,感到非常震撼,第一次在別的團(tuán)隊(duì)得到非共識驗(yàn)證。該網(wǎng)友還表示2025年會是Agent爆發(fā)的元年,非常期待。有開發(fā)者指出,Manus的核心架構(gòu)與 Anthropic的“ComputerUse”高度相似,均依賴多代理虛擬機(jī)環(huán)境完成任務(wù)。而其所謂的“自主規(guī)劃”能力,實(shí)則是基于現(xiàn)有大語言模型(如GPT-4)的調(diào)用,并未展示底層技術(shù)的突破。例如,在股票分析案例中, Manus僅通過調(diào)用雅虎金融API獲取數(shù)據(jù),再借助Python腳本生成可視化圖表,本質(zhì)仍是工具鏈的拼接。
綜合目前信息來看,Manus有其過人之處,但確實(shí)也有炒作嫌疑。該公司相關(guān)負(fù)責(zé)人今日在朋友圈發(fā)文稱,Manus從沒有開設(shè)任何付費(fèi)獲取邀請碼的渠道;Manus從未投放任何市場推廣預(yù)算;內(nèi)測期間將優(yōu)先保障現(xiàn)有用戶體驗(yàn),逐步有序開放邀請。盡管如此,今天一堆自媒體打著“朋友及人脈”旗號,準(zhǔn)時(shí)準(zhǔn)點(diǎn)在早上發(fā)文宣傳,有的還給Manus公司發(fā)過獎以及在發(fā)布前幾天在播客上預(yù)熱。產(chǎn)品還沒多少人真正體驗(yàn),先來一大波輿論助推,這不是營銷恐怕沒人信。到底是炒作還是真實(shí)力,還有待進(jìn)一步觀察。