關(guān)于DeepSeek的論文還有更多有趣的細(xì)節(jié)。盡管R1-Zero已經(jīng)具備了出色的推理能力,但它存在中英文混雜、可讀性差等問題。為了解決這些問題,DeepSeek重新訓(xùn)練了模型,并提供了一些冷啟動(dòng)數(shù)據(jù),從而推出了正式版本的R1。這個(gè)過程類似于雙語教育下的孩子,通過觀察大人對(duì)話,逐漸學(xué)會(huì)了區(qū)分使用不同語言。
這些經(jīng)歷讓我思考人類是否也是某種高維生命訓(xùn)練出來的AI。最后,推薦一個(gè)有趣的項(xiàng)目Spore,該項(xiàng)目中的AI智能體可以自己發(fā)推、發(fā)幣,為自己賺取電費(fèi),并且能夠分裂后代,遺傳特征,產(chǎn)生變異,與其他AI交互,盡可能生存和繁衍。
2024年1月20日,中國量化基金公司幻方發(fā)布的人工智能大模型DeepSeek-R1在全球科技界引起轟動(dòng)
2025-02-18 05:39:09DeepSeek爆火的啟示