23日,華大生命科學研究院與之江實驗室聯(lián)合發(fā)布了全球首個百億參數(shù)可部署的基因組通用基礎(chǔ)模型Genos。該模型支持多達百萬堿基對的超長上下文分析,并實現(xiàn)單堿基分辨率的精準識別。
人類基因組由30億對堿基組成,雖然“人類基因組計劃”已經(jīng)破譯了序列,但序列上堿基的具體功能仍需進一步識別和解析。現(xiàn)有模型大多基于1-2個參考基因組進行訓練,難以體現(xiàn)人類遺傳資源的多樣性。Genos整合了人類泛基因組參考聯(lián)盟、人類基因組結(jié)構(gòu)變異圖譜計劃等多個權(quán)威公開資源,首次將全球范圍內(nèi)636個高質(zhì)量人類基因組作為訓練數(shù)據(jù),這些數(shù)據(jù)覆蓋了全球不同人群,有助于更全面理解人類遺傳多樣性。
在算法架構(gòu)方面,Genos采用“混合專家”架構(gòu),能夠精準調(diào)度強相關(guān)算法協(xié)同處理,在匯總百億級龐大參數(shù)時成功降低推理成本和資源消耗,使模型既強大又好用。測試結(jié)果顯示,Genos在直接面向臨床應用的致病性突變解讀任務中準確率達92%,結(jié)合科學基礎(chǔ)模型后準確率高達98.3%。多項綜合評測結(jié)果表明,Genos超越了現(xiàn)有最佳水平模型。
目前,Genos模型已在HuggingFace、魔搭等平臺全面開源開放,提供12億和100億參數(shù)兩個版本,以滿足不同需求。
6月7日凌晨,騰訊官方公眾號發(fā)布消息,QQ昵稱為“愛芥末”的用戶成為全球首位擁有“時光企鵝”等級圖標的人,也是全球首位QQ256級用戶
2025-06-07 14:56:26全球首個滿級QQ誕生5月25日晚,一場名為《CMG世界機器人大賽·系列賽》的機甲格斗擂臺賽在杭州舉行,這是全球首個以人形機器人為參賽主體的格斗競技賽事
2025-05-26 17:38:50全球首個人形機器人格斗冠軍誕生