DeepSeek以低成本和少量芯片實現(xiàn)了與OpenAI等巨頭媲美的性能,引發(fā)國際AI界的廣泛關注。這意味著如果算力不再是決定AI性能的關鍵因素,之前大量投資英偉達芯片的邏輯可能會發(fā)生變化,其他相關行業(yè)也將受到影響。一位首席經(jīng)濟學家在微博上表達了這一觀點。
緊接著,周一亞洲市場率先感受到了“東方神秘力量”DeepSeek帶來的沖擊。A股中的DeepSeek概念暴漲超過11%,而算力相關的板塊如AI算力、GPU、液冷服務器和ASIC芯片等均大跌超3%。光芯片、高速銅互聯(lián)、光通信和光模塊等板塊跌幅更是達到5%以上。日本半導體ETF也下跌了超過3%。
實際上,DeepSeek帶來的焦慮甚至恐慌更多地體現(xiàn)在美國市場。周一納斯達克期貨跌近3%,計劃為美國AI投資千億美元的軟銀股價暴跌6%。市場擔心的問題不僅是中國AI技術追趕甚至超越美國,還包括對DeepSeek高效訓練方法的驚愕。這引發(fā)了關于美國科技巨頭囤積GPU的意義、英偉達市值的真實價值以及美國政府管制先進AI芯片出口效果的質疑。
令人驚訝的是,在中國獲取先進AI芯片受到嚴格限制的情況下,一家成立僅一年半且去年才推出首款大模型的年輕公司能夠給全球市場帶來如此震撼。該公司沒有迷信傳統(tǒng)的“大力出奇跡”的尺度定律,而是專注于創(chuàng)新訓練方法,減少了對計算資源的需求。
去年12月,DeepSeek發(fā)布了新一代開源大模型DeepSeek-v3,其能力接近閉源的GPT-4,但訓練成本僅為557.6萬美元,使用了2048張英偉達H800 AI芯片。相比之下,類似能力的模型通常需要1.6萬張GPU進行集群訓練,例如Meta發(fā)布的Llama-3-405B在類似的集群上花費了3080萬GPU小時,而DeepSeek僅用了約280萬GPU小時。
這種高效的訓練方式改變了AI對先進芯片和算力需求的邏輯。行業(yè)分析認為,DeepSeek開源讓一些對OpenAI封閉不滿的研究者感到高興,更重要的是,它展示了中國在先進算力受限情況下研發(fā)先進模型的能力。
白頭鷹再次針對一家小公司采取行動,使用的依舊是那些熟悉的手段。近期,一家初創(chuàng)公司推出的DeepSeek軟件在全球范圍內(nèi)引起轟動,在160多個國家的AI軟件下載排行榜上位居榜首
2025-02-04 19:33:47DeepSeek美股泡沫得以延續(xù)1月27日,中國人工智能初創(chuàng)公司DeepSeek迅速崛起,在中國即將迎來農(nóng)歷新年之際,這一事件影響了美國科技股市場,并引發(fā)了對美國技術主導地位的質疑
2025-01-28 09:12:00DeepSeek一夜掀翻美股