DeepSeek宣布在開源周第三天開源了DeepGEMM。這是一個(gè)專為簡(jiǎn)潔高效的FP8通用矩陣乘法(GEMM)設(shè)計(jì)的庫(kù),具備細(xì)粒度縮放功能。DeepGEMM支持普通和混合專家(MoE)分組的GEMM,采用CUDA編寫,在安裝過程中無(wú)需編譯,而是通過輕量級(jí)的即時(shí)編譯(JIT)模塊在運(yùn)行時(shí)編譯所有內(nèi)核。該庫(kù)為V3/R1訓(xùn)練和推理提供了支持。
北京時(shí)間2月27日10點(diǎn)5分,DeepSeek發(fā)布了其“開源周”第四日的內(nèi)容,包括優(yōu)化的并行策略
2025-02-27 14:05:06DeepSeek宣布開源優(yōu)化并行策略每經(jīng)AI快訊,2月28日,DeepSeek開源周第五天,DeepSeek在官方X賬號(hào)宣布開源3FS,它是所有Deepseek數(shù)據(jù)訪問的助推器
2025-02-28 11:52:14DeepSeek開源周第五天