火遍全球的DeepSeek科學(xué)家是怎么用它的。過年期間爆火的DeepSeek是一家專注于開發(fā)先進(jìn)大語(yǔ)言模型和相關(guān)技術(shù)的創(chuàng)新型科技公司,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日。在硅谷,DeepSeek被稱作“來(lái)自東方的神秘力量”。2024年底,DeepSeek發(fā)布了新一代大語(yǔ)言模型V3,隨后在2025年1月20日推出了開源模型R1,再次引發(fā)全球關(guān)注。R1模型通過純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,發(fā)布后在全球范圍內(nèi)掀起熱潮,在中國(guó)區(qū)和美國(guó)區(qū)蘋果AppStore免費(fèi)榜均位列首位,超越了包括ChatGPT在內(nèi)的多個(gè)知名AI產(chǎn)品。
火遍全球的DeepSeek:科學(xué)家是怎么用它的?創(chuàng)新技術(shù)引領(lǐng)未來(lái)方向
阿里云、百度智能云、華為云、騰訊云等國(guó)內(nèi)四大云巨頭以及海外的亞馬遜AWS、微軟Azure等云巨頭都已正式支持DeepSeek。春節(jié)期間,多家國(guó)產(chǎn)芯片廠商也積極響應(yīng),如天數(shù)智芯、摩爾線程等宣布支持DeepSeek模型。GiteeAI聯(lián)合沐曦還首發(fā)了全套DeepSeek-R1千問蒸餾模型,實(shí)現(xiàn)了從芯片到平臺(tái),從算力到模型的全國(guó)產(chǎn)研發(fā)、中國(guó)制造。
DeepSeek不僅在技術(shù)上表現(xiàn)出色,在市場(chǎng)上也取得了巨大成功。這款由中國(guó)的深度求索公司研發(fā)的大型語(yǔ)言模型擁有強(qiáng)大的自然語(yǔ)言處理能力,能夠理解并回答問題,還能輔助寫代碼、整理資料和解決復(fù)雜的數(shù)學(xué)問題。與OpenAI開發(fā)的Chat-GPT相比,DeepSeek以更低的成本達(dá)到了相似甚至更好的效果,引發(fā)了廣泛討論。DeepSeek代表了AI的未來(lái)方向——更懂人話,更會(huì)思考,并且擅長(zhǎng)個(gè)性化發(fā)揮,被稱為“全能型AI助手”。
隨著DeepSeek掀起新一輪AI熱潮,業(yè)內(nèi)人士認(rèn)為它將推動(dòng)AI實(shí)現(xiàn)“平民化”。正如蘋果iPhone改變了人們的生活方式,DeepSeek將通過開源系統(tǒng)讓更多開發(fā)者開發(fā)出有用的AI應(yīng)用場(chǎng)景,使AI走入普通人的生活。AI開源初創(chuàng)公司HuggingFace聯(lián)合創(chuàng)始人Thomas Wolf表示,下一步將是建立在這些模型之上的應(yīng)用,讓模型在應(yīng)用層面變得有用,從而完成現(xiàn)實(shí)中的任務(wù),讓人們?cè)谏钪惺芤妗?/p>
然而,DeepSeek的成功也引起了某些勢(shì)力的注意。1月30日凌晨,針對(duì)DeepSeek線上服務(wù)的攻擊烈度突然升級(jí),至少有2個(gè)僵尸網(wǎng)絡(luò)參與了攻擊。中國(guó)常駐聯(lián)合國(guó)代表傅聰對(duì)此表示:“永遠(yuǎn)不要低估中國(guó)科研人員的聰明才智。DeepSeek引發(fā)全球轟動(dòng)和一些人的焦慮恐慌,說(shuō)明技術(shù)遏制和技術(shù)限制無(wú)法奏效?!?/p>
DeepSeek之所以讓美國(guó)感到緊張,主要因?yàn)樗哂懈咝詢r(jià)比、模式創(chuàng)新和顯著的進(jìn)步。DeepSeek的出現(xiàn)打破了美國(guó)大模型的壟斷地位,降低了行業(yè)門檻,并通過創(chuàng)新的數(shù)據(jù)處理方法優(yōu)化了算力,提升了模型性能。這不僅沖擊了美國(guó)的技術(shù)優(yōu)勢(shì),也引發(fā)了美國(guó)高新技術(shù)人員的擔(dān)憂。根據(jù)報(bào)告,2024年國(guó)內(nèi)大模型的能力進(jìn)步顯著,國(guó)內(nèi)外差距大幅縮小。這表明DeepSeek的成功是中國(guó)國(guó)內(nèi)大模型整體發(fā)展的階段性成果。