華為計劃于11月21日發(fā)布一項AI領(lǐng)域的突破性技術(shù),旨在解決算力資源利用效率問題。這項技術(shù)可以將GPU、NPU等算力資源的利用率從行業(yè)平均的30%至40%提升至70%,顯著釋放硬件潛能。
該技術(shù)通過軟件創(chuàng)新實現(xiàn)英偉達、昇騰及其他三方算力的統(tǒng)一資源管理與利用,屏蔽算力硬件差異,為AI訓練推理提供更高效的資源支撐。這一技術(shù)路徑與以色列AI初創(chuàng)公司Run:ai的核心技術(shù)路線有共同之處。Run:ai自2018年成立以來,專注于GPU調(diào)度技術(shù),致力于打造一個能將AI模型拆分并行運行的平臺,無論硬件位于本地、云端還是邊緣。
Run:ai的核心產(chǎn)品基于kubernetes構(gòu)建,用于調(diào)度GPU的計算資源。通過動態(tài)調(diào)度、池化、分片等技術(shù),優(yōu)化GPU資源利用率,使深度學習訓練與推理任務(wù)在企業(yè)級環(huán)境中高效運行。管理生成式AI、推薦系統(tǒng)、搜索引擎等工作負載時,需要復雜的調(diào)度來優(yōu)化系統(tǒng)和底層硬件性能。
11月19日,谷歌發(fā)布了其最新、最先進的基礎(chǔ)模型Gemini 3,用戶現(xiàn)在可以通過Gemini應用和AI搜索界面立即使用
2025-11-19 08:11:05谷歌發(fā)布Gemini36月3日,華為終端宣布首款鴻蒙AI智能手表華為WATCH 5將于6月11日14:30華為Pura 80系列及全場景新品發(fā)布會上正式發(fā)布,將搭載鴻蒙操作系統(tǒng)5
2025-06-03 16:43:50鴻蒙AI手表來了