电竞下注-中国电竞赛事及体育赛事平台

首頁
新聞
軍事
財經(jīng)
娛樂
汽車
游戲
文化
援藏
插畫
健康
公益
優(yōu)選
法制
守藝中華
應急中國
更多
佛學文史古詩詞人物解夢生活商業(yè)數(shù)智
地方頻道
湖北山東山西絲路

注冊登錄

中華網(wǎng) china.com

新聞

國內(nèi) 國際社會體育專題軍事財經(jīng) 滾動政務冬奧

清華團隊突破大模型算力難題英偉達面臨挑戰(zhàn)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-02-15 16:16:59 新浪

清華大學KVCache.AI團隊聯(lián)合趨境科技發(fā)布了KTransformers開源項目的重大更新，成功打破了大模型推理算力的門檻。這次更新支持在24G顯存（4090D）的設備上本地運行DeepSeek-R1、V3的671B滿血版。

KTransformers項目的核心在于異構(gòu)計算策略。通過稀疏性利用，MoE架構(gòu)每次僅激活部分專家模塊，團隊將非共享的稀疏矩陣卸載至CPU內(nèi)存，并結(jié)合高速算子處理，使顯存占用壓縮至24GB。此外，項目采用了4bit量化技術(shù)，配合Marlin GPU算子，效率提升了3.87倍；CPU端通過llamafile實現(xiàn)多線程并行，預處理速度達到286 tokens/s。CUDA Graph加速減少了CPU/GPU通信開銷，單次解碼只需一次完整的CUDA Graph調(diào)用，生成速度可達14 tokens/s。

這一突破帶來的影響顯著。傳統(tǒng)方案中，使用8卡A100服務器的成本超過百萬，按需計費每小時數(shù)千元。而現(xiàn)在，單卡RTX 4090方案的整機成本約為2萬元，功耗僅為80W，非常適合中小團隊和個人開發(fā)者。NVIDIA RTX 4090運行DeepSeek-R1滿血版的案例不僅展示了技術(shù)奇跡，也是開源精神與硬件潛能結(jié)合的典范。這證明了在AI快速發(fā)展的時代，創(chuàng)新往往源于對“不可能”的挑戰(zhàn)。

(責任編輯：張蕾)

關(guān)閉

聯(lián)想MWC 2025發(fā)布概念性筆電生態(tài) 模塊化AI創(chuàng)新引領未來

聯(lián)想MWC2025發(fā)布概念性筆電生態(tài)2025-03-03 17:13:41

奚夢瑤何超欣姑嫂出游像閨蜜奚夢瑤何超欣一起出游參觀法國酒莊

奚夢瑤何超欣姑嫂出游像閨蜜2025-03-03 17:08:37

全球每年120萬人因吸二手煙死亡每4秒1人逝去

全球每年120萬人因吸二手煙死亡2025-03-03 17:08:06

美國多地爆發(fā)“抵制特斯拉”示威活動，白宮發(fā)聲抗議持續(xù)蔓延

美國多地爆發(fā)抵制特斯拉示威活動,白宮發(fā)聲2025-03-03 14:44:43

新研究揭示月球水源雙重起源挑戰(zhàn)太陽風理論

新研究揭示月球水源雙重起源2025-03-03 16:51:53

白宮碰壁后澤連斯基在唐寧街受到禮遇，歐洲在壓力與無奈中集結(jié) 歐洲集結(jié)聲援烏克蘭

白宮碰壁后澤連斯基在唐寧街受到禮遇,歐洲在壓力與無奈中集結(jié)2025-03-03 16:33:24

全球每年120萬人因吸二手煙死亡每4秒1人逝去

全球每年120萬人因吸二手煙死亡2025-03-03 17:08:06

《180天重啟計劃》母女成長之路溫情治愈之旅

180天重啟計劃母女成長之路2025-03-03 16:49:33

種種跡象表明，美國準備搞掉澤連斯基了換一個聽話的人

種種跡象表明,美國準備搞掉澤連斯基了2025-03-03 14:37:51

山東新人冒雪結(jié)婚一秒“白頭” 真愛無懼風雪

山東新人冒雪結(jié)婚一秒白頭2025-03-03 16:44:58

毛不易演唱會北方三城官宣東北家鄉(xiāng)驚喜連連

毛不易演唱會北方三城官宣2025-03-03 17:05:12

各地搶抓“春日經(jīng)濟”流量紅利賞花熱帶動旅游消費

各地搶抓春日經(jīng)濟流量紅利2025-03-03 16:54:02

美國經(jīng)濟的危險深淵：從“拜登通脹”到“特朗普滯脹”？滯脹風險加劇

美國經(jīng)濟的危險深淵,從拜登通脹到特朗普滯脹2025-03-03 14:29:16

若特朗普說話算數(shù) 烏軍將有多慘？援助切斷后果嚴重

若特朗普說話算數(shù)烏軍將有多慘2025-03-03 16:45:31

政協(xié)委員建議合理控制醫(yī)保保費漲幅探索匹配收入增長機制

政協(xié)委員建議合理控制醫(yī)保保費漲幅2025-03-03 16:43:11

德媒發(fā)現(xiàn)馮德萊恩對中國口氣變了尋求合作新契機

德媒發(fā)現(xiàn)馮德萊恩對中國口氣變了2025-03-03 17:00:02

寒潮來襲，雪中濟南“菜籃子”量足價穩(wěn)！

寒潮來襲雪中濟南菜籃子量足價穩(wěn)2025-03-03 16:54:35

奚夢瑤何超欣姑嫂出游像閨蜜奚夢瑤何超欣一起出游參觀法國酒莊

奚夢瑤何超欣姑嫂出游像閨蜜2025-03-03 17:08:37

澤連斯基與特朗普談崩后歐洲能重回俄烏沖突談判桌嗎？歐洲面臨歷史性抉擇

澤連斯基與特朗普談崩后歐洲能重回俄烏沖突談判桌嗎2025-03-03 16:43:07

澤連斯基稱當下取代他并不容易愿辭職換北約成員資格

澤連斯基稱當下取代他并不容易2025-03-03 16:07:21

澤連斯基反諷稱可以授予美議員烏公民身份這樣他聲音才有分量

澤連斯基反諷稱可以授予美議員烏公民身份2025-03-03 14:25:48

專家談特朗普所信奉的“交易藝術(shù)” 極限施壓俄烏局勢

專家談特朗普所信奉的交易藝術(shù)2025-03-03 14:58:40

白鹿說因為《警察榮譽》才能演《北上》

白鹿說因為警察榮譽才能演北上2025-03-03 17:00:29

美烏領導人談崩，馬克龍“勸架”！呼吁冷靜與尊重

美烏領導人談崩,馬克龍勸架2025-03-03 15:31:48

臺名嘴圍觀白宮“世紀爭吵”后反思“人為刀俎我為魚肉”“當棋子的悲哀”

臺名嘴圍觀白宮“世紀爭吵”后反思2025-03-03 16:29:44

烏步兵戰(zhàn)車遭俄無人機襲擊后殉爆俄軍光纖無人機精確打

烏步兵戰(zhàn)車遭俄無人機襲擊后殉爆2025-03-03 16:27:32

美媒稱歐洲正從美國手中奪取和談主導權(quán) 英法提議烏克蘭?；鹨粋€月

美媒稱歐洲正從美國手中奪取和談主導權(quán)2025-03-03 16:47:51

官方通報馬拉松選手在中學門前小便不文明行為遭譴責

官方通報馬拉松選手在中學門前小便2025-03-03 16:58:49

緬甸4名高級軍官涉嫌電詐被拘打擊行動持續(xù)升級

緬甸4名高級軍官涉嫌電詐被拘2025-03-03 16:47:07

聯(lián)想MWC 2025發(fā)布概念性筆電生態(tài) 模塊化AI創(chuàng)新引領未來

聯(lián)想MWC2025發(fā)布概念性筆電生態(tài)2025-03-03 17:13:41

澤連斯基再表態(tài)：愿以辭職換取烏克蘭加入北約堅定立場引發(fā)關(guān)注

澤連斯基再表態(tài),愿以辭職換取烏克蘭加入北約2025-03-03 16:09:51

特朗普發(fā)話少擔心普京多擔心移民問題關(guān)注國內(nèi)安全挑戰(zhàn)

特朗普發(fā)話少擔心普京多擔心移民問題2025-03-03 14:46:16

澤連斯基：“沒有一天不感激”美國強調(diào)美國支持的重要性

澤連斯基,沒有一天不感激美國2025-03-03 14:23:27

102項重大工程98%以上完成目標有力支撐高質(zhì)量發(fā)展

102項重大工程98%以上完成目標2025-03-03 16:50:07

女子吃了未熟香菇身體像被“鞭打” 警惕香菇皮炎

女子吃了未熟香菇身體像被鞭打2025-03-03 17:02:44

相關(guān)新聞

從DeepSeek看AI趨勢大模型推動算力革命
在ChatGPT掀起全球AI熱潮兩年后，大模型領域迎來了一位新星——DeepSeek。憑借高性能、低成本以及完全開源的特點，DeepSeek迅速吸引了公眾的目光，成為市場上的“鯰魚”
2025-02-14 17:24:33從DeepSeek看AI趨勢
機構(gòu)扎堆調(diào)研“AI”板塊聚焦大模型與算力需求
進入2月份以來，受DeepSeek引發(fā)的本地部署大模型等因素驅(qū)動，上市公司機構(gòu)調(diào)研的重點轉(zhuǎn)向了AI大模型、AI算力、人形機器人等領域
2025-02-16 13:09:04機構(gòu)扎堆調(diào)研AI板塊
清華翟季冬：DeepSeek 百倍算力效能背后的系統(tǒng)革命智者訪談多模態(tài)大模型再升級
就在DeepSeek在華爾街和應用下載榜上引起轟動的同時，深度求索公司在除夕夜再次推出了新的產(chǎn)品
2025-02-01 13:13:44清華翟季冬
大模型企業(yè)分化算力成買方市場 AI產(chǎn)業(yè)迎來轉(zhuǎn)折點
自2024年起，人工智能產(chǎn)業(yè)見證了顯著的轉(zhuǎn)型期。據(jù)統(tǒng)計，截至同年10月9日，共有188個人工智能大模型通過網(wǎng)信辦備案，意味著這些模型具備上線提供服務的資格
2024-10-13 02:57:00大模型企業(yè)分化
清華光電融合芯片算力是GPU的3000多倍？媒體搞出的大新聞
近年來，人工智能突破引發(fā)了高性能GPU需求暴增。GPU生產(chǎn)商英偉達2023年市值增長239.2%，2024年又漲了45.9%，截至2月12日市值達到1.78萬億美元。GPU已經(jīng)成為全球高科技業(yè)界最炙手可熱的商品之一，美國商務部還特別針對中國限制GPU性能，連游戲玩家用的RTX 4090都不讓賣了。
2024-12-02 14:18:14清華光電融合芯片算力是GPU的3000多倍？媒體搞出的大新聞
聯(lián)想聯(lián)合沐曦發(fā)布DeepSeek一體機解決方案破解企業(yè)算力部署難題
2月5日，聯(lián)想集團與沐曦股份聯(lián)合發(fā)布了基于DeepSeek大模型的一體機解決方案
2025-02-05 16:24:07聯(lián)想聯(lián)合沐曦發(fā)布DeepSeek一體機解決方案

今日熱點

4歲女童甲流合并細菌感染"白肺" 病情急轉(zhuǎn)直下引發(fā)關(guān)注

段永平：80%以上散戶牛市熊市都虧錢投機更難悟透

男子在九寨溝景區(qū)扔玉米棒被游客指責素質(zhì)問題引爭議

《QQ愛》原唱：歌曲被王麟長期侵權(quán) 雙方各執(zhí)一詞

頻道熱點

主編郵箱
網(wǎng)上不良信息舉報電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務 | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動態(tài)
版權(quán)所有中華網(wǎng)

<ol id="umljb"><tr id="umljb"></tr></ol>

<big id="umljb"></big>

<big id="umljb"><object id="umljb"></object></big>

<var id="umljb"></var>