谷歌旗下最強圖像模型來了!當(dāng)?shù)貢r間8月26日,谷歌推出了最新的圖像生成與編輯模型Gemini 2.5 Flash Image,代號“納米香蕉”。該模型在LMArena基準測試中排名首位,具有保持角色一致性、自然語言精準修圖和多圖融合等功能,并通過Gemini世界知識進一步增強了其智能表現(xiàn)。用戶可以通過Gemini App或API訪問這一模型,API定價為每百萬輸出token 30美元。根據(jù)官方數(shù)據(jù),生成一張圖片大約需要1290個輸出token,成本約為0.039美元。
谷歌DeepMind團隊于5月27日宣布推出SignGemma,這是其迄今為止最強大的手語翻譯模型,能夠?qū)⑹终Z轉(zhuǎn)化為口語文本。該開源模型計劃在今年晚些時候加入Gemma模型家族
2025-05-31 23:30:49谷歌DeepMind最強手語翻譯模型登場5月21日凌晨,谷歌在全球開發(fā)者大會“I/O 2025”上發(fā)布了AI全家桶——Google AI Ultra
2025-05-21 09:22:32Google發(fā)布最強AI全家桶