我國(guó)研發(fā)的全球首個(gè)多模態(tài)地理科學(xué)大模型“坤元”9月19日在京發(fā)布。“坤元”可實(shí)現(xiàn)地理專業(yè)問題解答、地理學(xué)文獻(xiàn)智能分析、地理數(shù)據(jù)資源查詢、地理數(shù)據(jù)挖掘分析、專題地圖繪制等功能,有望賦能地理科學(xué)研究,加速重大地理科學(xué)發(fā)現(xiàn)。
“坤元”是專注于地理科學(xué)的專業(yè)語(yǔ)言大模型,由中國(guó)科學(xué)院地理科學(xué)與資源研究所、中國(guó)科學(xué)院青藏高原研究所、中國(guó)科學(xué)院自動(dòng)化研究所等單位共同研發(fā),具備“懂地理”“精配圖”“知人心”“智生圖”等特點(diǎn)。
據(jù)介紹,研發(fā)團(tuán)隊(duì)建立了涵蓋4大類、16小類的地理全學(xué)科語(yǔ)料庫(kù),提供320億詞元供大模型自監(jiān)督學(xué)習(xí),并制作了4萬余條高質(zhì)量地理學(xué)指令進(jìn)行模型微調(diào)。相比通用語(yǔ)言大模型,“坤元”更熟悉地理學(xué)的語(yǔ)言模式、專業(yè)術(shù)語(yǔ)和領(lǐng)域知識(shí)。
“坤元”可以根據(jù)生成的文字答案檢索不同地理要素,并匹配地理景觀照片、專題地圖或示意圖表呈現(xiàn)給提問者;可以根據(jù)用戶指令完成概念理解、數(shù)據(jù)獲取、信息分析等流程,最終生成用戶需要的專業(yè)地理圖表;還能充分考慮不同類型用戶的地理知識(shí)結(jié)構(gòu)和表達(dá)差異,給出適配不同用戶的專業(yè)解答。
“‘坤元’有助于解放地理從業(yè)者的雙手,賦能地理科學(xué)研究,加速重大地理科學(xué)發(fā)現(xiàn),目前已支撐發(fā)表高水平學(xué)術(shù)論文10余篇。”中國(guó)科學(xué)院地理科學(xué)與資源研究所副所長(zhǎng)蘇奮振說。
據(jù)介紹,研發(fā)團(tuán)隊(duì)接下來將推進(jìn)地圖大模型及地理推理機(jī)研發(fā),有望讓地理科學(xué)語(yǔ)言大模型讀懂地圖;還將打造地理科研協(xié)作大平臺(tái),讓科學(xué)家通過共享數(shù)據(jù)、模型、研究思路等方式協(xié)同工作。( 張泉)