火遍全球的DeepSeek科學(xué)家是怎么用它的。過年期間爆火的DeepSeek是一家專注于開發(fā)先進(jìn)大語言模型和相關(guān)技術(shù)的創(chuàng)新型科技公司,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日。在硅谷,DeepSeek被稱作“來自東方的神秘力量”。2024年底,DeepSeek發(fā)布了新一代大語言模型V3,隨后在2025年1月20日推出了開源模型R1,再次引發(fā)全球關(guān)注。R1模型通過純深度學(xué)習(xí)的方法讓AI自發(fā)涌現(xiàn)出推理能力,發(fā)布后在全球范圍內(nèi)掀起熱潮,在中國區(qū)和美國區(qū)蘋果AppStore免費(fèi)榜均位列首位,超越了包括ChatGPT在內(nèi)的多個(gè)知名AI產(chǎn)品。
火遍全球的DeepSeek:科學(xué)家是怎么用它的?創(chuàng)新技術(shù)引領(lǐng)未來方向
阿里云、百度智能云、華為云、騰訊云等國內(nèi)四大云巨頭以及海外的亞馬遜AWS、微軟Azure等云巨頭都已正式支持DeepSeek。春節(jié)期間,多家國產(chǎn)芯片廠商也積極響應(yīng),如天數(shù)智芯、摩爾線程等宣布支持DeepSeek模型。GiteeAI聯(lián)合沐曦還首發(fā)了全套DeepSeek-R1千問蒸餾模型,實(shí)現(xiàn)了從芯片到平臺,從算力到模型的全國產(chǎn)研發(fā)、中國制造。
DeepSeek不僅在技術(shù)上表現(xiàn)出色,在市場上也取得了巨大成功。這款由中國的深度求索公司研發(fā)的大型語言模型擁有強(qiáng)大的自然語言處理能力,能夠理解并回答問題,還能輔助寫代碼、整理資料和解決復(fù)雜的數(shù)學(xué)問題。與OpenAI開發(fā)的Chat-GPT相比,DeepSeek以更低的成本達(dá)到了相似甚至更好的效果,引發(fā)了廣泛討論。DeepSeek代表了AI的未來方向——更懂人話,更會思考,并且擅長個(gè)性化發(fā)揮,被稱為“全能型AI助手”。
隨著DeepSeek掀起新一輪AI熱潮,業(yè)內(nèi)人士認(rèn)為它將推動(dòng)AI實(shí)現(xiàn)“平民化”。正如蘋果iPhone改變了人們的生活方式,DeepSeek將通過開源系統(tǒng)讓更多開發(fā)者開發(fā)出有用的AI應(yīng)用場景,使AI走入普通人的生活。AI開源初創(chuàng)公司HuggingFace聯(lián)合創(chuàng)始人Thomas Wolf表示,下一步將是建立在這些模型之上的應(yīng)用,讓模型在應(yīng)用層面變得有用,從而完成現(xiàn)實(shí)中的任務(wù),讓人們在生活中受益。