9月19日,中國(guó)科學(xué)院地理科學(xué)與資源研究所攜手中國(guó)科學(xué)院青藏高原研究所、中國(guó)科學(xué)院自動(dòng)化研究所等機(jī)構(gòu),共同推出了多模態(tài)地理科學(xué)大模型“坤元”(Sigma Geography)。這一大模型專(zhuān)為地理科學(xué)領(lǐng)域設(shè)計(jì),具有處理專(zhuān)業(yè)地理問(wèn)題的能力。研發(fā)過(guò)程中,團(tuán)隊(duì)不僅構(gòu)建了全面覆蓋地理學(xué)的高質(zhì)量語(yǔ)料庫(kù),還開(kāi)發(fā)了地理科學(xué)語(yǔ)言大模型及智導(dǎo)研究平臺(tái),使“坤元”能夠展現(xiàn)出深厚的地理學(xué)理解力、精準(zhǔn)的地圖匹配能力、對(duì)用戶需求的洞察力以及自動(dòng)生成圖表的功能。它能完成地理問(wèn)題解答、文獻(xiàn)智能化分析、數(shù)據(jù)資源查詢、數(shù)據(jù)分析挖掘以及專(zhuān)題地圖繪制等多種任務(wù)。
為了提升專(zhuān)業(yè)度,研發(fā)團(tuán)隊(duì)創(chuàng)建了一個(gè)包含四大類(lèi)別、十六小類(lèi)的全方位地理學(xué)科語(yǔ)料庫(kù),內(nèi)置320億詞元供模型自我學(xué)習(xí),并精心準(zhǔn)備了超過(guò)4萬(wàn)條高質(zhì)地理學(xué)指令來(lái)微調(diào)模型性能。與一般的通用語(yǔ)言模型相比,“坤元”對(duì)地理學(xué)術(shù)語(yǔ)、專(zhuān)業(yè)表達(dá)及領(lǐng)域知識(shí)的掌握更為深入,其在地理學(xué)特定測(cè)試中的準(zhǔn)確率提高了31.3%。
“坤元”的目標(biāo)是拓寬公眾的地理認(rèn)知邊界,為地理從業(yè)者提供高效工具,促進(jìn)地理智能技術(shù)的發(fā)展,增強(qiáng)地理科學(xué)研究能力,并加速重要地理科學(xué)發(fā)現(xiàn)的進(jìn)程。展望未來(lái),研發(fā)團(tuán)隊(duì)計(jì)劃進(jìn)一步研發(fā)地圖大模型及地理推理機(jī),使模型能夠真正“閱讀”并理解地圖。同時(shí),他們還將建立一個(gè)地理科研協(xié)作平臺(tái),旨在讓每位科學(xué)家和研究團(tuán)隊(duì)都能擁有自己的地理大模型,通過(guò)平臺(tái)實(shí)現(xiàn)數(shù)據(jù)、模型及研究思路的共享,促進(jìn)數(shù)百萬(wàn)科學(xué)家之間的合作與創(chuàng)新。