一夜之間,OpenAI和Claude母公司Anthropic對DeepSeek發(fā)起了指責。據(jù)《金融時報》報道,OpenAI聲稱發(fā)現(xiàn)證據(jù),證明DeepSeek利用其模型進行訓練,涉嫌侵犯知識產(chǎn)權(quán)。具體而言,他們發(fā)現(xiàn)了DeepSeek“蒸餾”O(jiān)penAI模型的跡象,即使用更大模型的輸出來提高較小模型的性能,以較低成本在特定任務上取得類似結(jié)果。微軟也開始調(diào)查DeepSeek是否使用了OpenAI的API。
消息一出,引來了一波嘲諷。紐約大學教授馬庫斯表示,OpenAI需要免費使用所有藝術(shù)家和作家的作品訓練模型,然后用省下的錢去起訴DeepSeek。知名技術(shù)媒體404 Media創(chuàng)始人及主編Jason也諷刺OpenAI只許州官放火。
另一方面,Anthropic創(chuàng)始人Dario Amodei發(fā)表長文稱,說DeepSeek構(gòu)成威脅太夸張了,只是達到了他們7-10個月前的水平,Claude 3.5 Sonnet在許多評估中依然領(lǐng)先。不過,為了保持領(lǐng)先,他建議設(shè)置更多限制。
相比之下,微軟的做法顯得耐人尋味。就在指控DeepSeek涉嫌侵權(quán)后不久,微軟的AI平臺上接入了DeepSeek模型。網(wǎng)友調(diào)侃道,否認是接受的第一步。
目前,微軟和OpenAI對DeepSeek的質(zhì)疑仍處于調(diào)查階段。根據(jù)微軟工作人員的說法,DeepSeek可能在去年秋天調(diào)用了OpenAI的API,導致數(shù)據(jù)泄露。按照OpenAI的服務條款,任何人都可以注冊使用其API,但不能使用輸出數(shù)據(jù)訓練對其造成競爭威脅的模型。OpenAI拒絕進一步置評,也不愿提供證據(jù)細節(jié)。
模型蒸餾是一種壓縮技術(shù),通過將復雜的大模型的知識轉(zhuǎn)移到更小、更高效的模型中。這種技術(shù)在學術(shù)界和工業(yè)界非常普遍且被認可。例如,Together AI曾將Llama 3蒸餾到Mamba,實現(xiàn)推理速度提升。IBM的文章也提到,知識蒸餾已成為生成式AI普惠化的重要工具。
臺退將:臺民眾不要迷信美國會出兵。這位臺退將的話一語中的,頭腦清醒。
2024-09-26 10:17:28臺退將:臺民眾不要迷信美國會出兵