首頁 > 行業(yè) > 正文

讓“機(jī)器化學(xué)家”更好賦能化學(xué)研究

2025-02-17 18:13:03來源:科技日報(bào)  

來源標(biāo)題:讓“機(jī)器化學(xué)家”更好賦能化學(xué)研究

當(dāng)前,人工智能已經(jīng)全面滲透到科學(xué)研究的各個(gè)領(lǐng)域。以化學(xué)學(xué)科為例,得益于AI的應(yīng)用,化學(xué)反應(yīng)預(yù)測與新化學(xué)物質(zhì)的發(fā)現(xiàn)、化學(xué)試驗(yàn)的自動化與智能化等均取得了顯著突破。特別是人工智能驅(qū)動的機(jī)器人,即“機(jī)器化學(xué)家”,可以自動閱讀文獻(xiàn)、遠(yuǎn)程執(zhí)行實(shí)驗(yàn)方案、借助計(jì)算機(jī)即時(shí)優(yōu)化實(shí)驗(yàn)條件,將科研人員從重復(fù)繁雜的勞動中解放出來,大大提升了科研活動效率。然而,筆者在調(diào)研中發(fā)現(xiàn),機(jī)器化學(xué)家仍然面臨諸多問題與挑戰(zhàn),需要加強(qiáng)統(tǒng)籌部署。

機(jī)器化學(xué)家未來發(fā)展面臨諸多問題

機(jī)器化學(xué)家是能夠自主執(zhí)行化學(xué)研究的人工智能機(jī)器人。與其他復(fù)雜的實(shí)驗(yàn)室系統(tǒng)相比,機(jī)器化學(xué)家具有完整的人工智能軟件、復(fù)雜的內(nèi)部循環(huán)(如假設(shè)生成、選擇、評估和完善)以及以高通量執(zhí)行單獨(dú)規(guī)劃的循環(huán)實(shí)驗(yàn)?zāi)芰Α?/p>

目前,機(jī)器化學(xué)家廣泛應(yīng)用于新型分子合成和功能材料創(chuàng)制等方面,幫助科研人員解決了大量科學(xué)難題。

但筆者調(diào)研發(fā)現(xiàn),雖然我國機(jī)器化學(xué)家在智能化學(xué)創(chuàng)新領(lǐng)域已經(jīng)居于全球領(lǐng)跑地位,但其在核心算法和算力、高質(zhì)量化學(xué)數(shù)據(jù)集方面仍存在不足,未來發(fā)展面臨相關(guān)研究人才缺乏、資源平臺分散等問題。

第一,原創(chuàng)核心算法和算力不足。一是我國在算法領(lǐng)域缺乏以數(shù)學(xué)為基礎(chǔ)的原始核心模型、代碼和框架創(chuàng)新,機(jī)器化學(xué)家與國外同類平臺相比仍有差距。例如,當(dāng)前英國利物浦大學(xué)的研究團(tuán)隊(duì)研發(fā)的機(jī)器化學(xué)家采用了啟發(fā)式算法,將化學(xué)家長期積累的專業(yè)知識巧妙融入到機(jī)器化學(xué)家的決策流程中,在處理化學(xué)實(shí)驗(yàn)問題時(shí)具有獨(dú)特優(yōu)勢。二是我國在算力領(lǐng)域仍面臨一些“卡脖子”問題。中國科技大學(xué)等單位自主研發(fā)的ChemGPT是一種化學(xué)領(lǐng)域的聊天機(jī)器人程序,可以基于論文知識來建議實(shí)驗(yàn)方案等,但因?yàn)镚PU算力不足,ChemGPT“跑不快”,訓(xùn)練迭代很慢。

第二,缺乏高質(zhì)量的化學(xué)數(shù)據(jù)集。雖然機(jī)器化學(xué)家已經(jīng)建立了包含8000萬化合物、1000萬化學(xué)反應(yīng)等資源的數(shù)據(jù)庫和檢索引擎,但目前依然面臨實(shí)驗(yàn)數(shù)據(jù)缺乏和實(shí)驗(yàn)數(shù)據(jù)標(biāo)準(zhǔn)化不夠等問題。一是目前數(shù)據(jù)大多來源于國外數(shù)據(jù)庫,獲取成本很高。二是數(shù)據(jù)采集過程不統(tǒng)一,不同設(shè)備、環(huán)境、操作人員得到的數(shù)據(jù)有很大差異。實(shí)驗(yàn)生成的不同類型的數(shù)據(jù)包括圖像、結(jié)構(gòu)數(shù)據(jù)等格式不同。三是數(shù)據(jù)質(zhì)量有待提高?;瘜W(xué)研究的精準(zhǔn)化和智能化依賴實(shí)驗(yàn)數(shù)據(jù)的準(zhǔn)確性,但現(xiàn)階段我國高質(zhì)量的科研數(shù)據(jù)較為匱乏,很多科研數(shù)據(jù)都從文獻(xiàn)中收集,而文獻(xiàn)中的數(shù)據(jù)常常是被“美化”過的理想數(shù)據(jù)。

第三,缺乏“人工智能+化學(xué)”的復(fù)合型人才。機(jī)器化學(xué)家的發(fā)展需要化學(xué)、物理、數(shù)學(xué)、計(jì)算機(jī)、自動化等多學(xué)科專業(yè)人才的跨學(xué)科合作,但目前大多數(shù)人才都是單學(xué)科人才。雖然有些高校和科研機(jī)構(gòu)已經(jīng)開始積極探索跨學(xué)科的課程設(shè)計(jì)和項(xiàng)目合作,但仍處于起步階段。同時(shí),行業(yè)內(nèi)部缺乏有效的內(nèi)部培養(yǎng)和培訓(xùn)機(jī)制。此外,相關(guān)領(lǐng)域的技術(shù)工程師同樣缺乏。

第四,缺乏高度整合且開放的人工智能資源平臺。目前,中國科學(xué)技術(shù)大學(xué)、北京大學(xué)、清華大學(xué)、浙江大學(xué)、華東師范大學(xué)、中國科學(xué)院寧波材料技術(shù)與工程研究所等單位多個(gè)化學(xué)研究團(tuán)隊(duì)都在進(jìn)行機(jī)器化學(xué)家的相關(guān)研究與部署,其中不免出現(xiàn)“百模大戰(zhàn)”,數(shù)據(jù)庫、算力平臺等資源分散、重復(fù)建設(shè)等情況,缺乏一個(gè)共建的開放式人工智能資源平臺,使各團(tuán)隊(duì)實(shí)驗(yàn)數(shù)據(jù)可以交匯、共享,自動提煉出數(shù)字化知識圖譜和人工智能模型,進(jìn)而指導(dǎo)機(jī)器化學(xué)家自動優(yōu)化,研制出更好、更高效的化學(xué)品。

加強(qiáng)部署搶占未來化學(xué)研究制高點(diǎn)

當(dāng)前,人工智能已經(jīng)成為各國爭奪未來化學(xué)研究制高點(diǎn)的抓手。針對目前機(jī)器化學(xué)家面臨的問題與挑戰(zhàn),建議從數(shù)據(jù)、人才、技術(shù)攻關(guān)等方面加強(qiáng)部署。

第一,加快建設(shè)高質(zhì)量的化學(xué)數(shù)據(jù)庫或知識庫。破除數(shù)據(jù)壁壘,整合國內(nèi)目前已有的相關(guān)數(shù)據(jù)庫和分散存在的小型數(shù)據(jù)庫,對數(shù)據(jù)格式、標(biāo)準(zhǔn)、工具及代碼等進(jìn)行統(tǒng)一規(guī)劃設(shè)計(jì),進(jìn)一步提升相關(guān)數(shù)據(jù)庫的數(shù)據(jù)質(zhì)量。加強(qiáng)人工智能模型訓(xùn)練的化學(xué)數(shù)據(jù)庫建設(shè),使用新的人工智能模型生成高質(zhì)量數(shù)據(jù)。發(fā)展具有可遷移性的機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)數(shù)據(jù)的高效、高精度提取,為數(shù)據(jù)驅(qū)動的智能化學(xué)提供基礎(chǔ)。將化學(xué)數(shù)據(jù)庫和知識庫作為重要研究成果,納入科研人員考評、項(xiàng)目驗(yàn)收機(jī)制。

第二,盡快重構(gòu)化學(xué)研究人才體系。人工智能驅(qū)動的化學(xué)研究既需要科研人員具備扎實(shí)的基礎(chǔ)和開放的心態(tài),還需要多領(lǐng)域人才協(xié)作。應(yīng)在高校本科化學(xué)系設(shè)置編程、人工智能和自動化課程,鼓勵(lì)學(xué)生進(jìn)行STEM與社會科學(xué)課程的交叉學(xué)習(xí),為研究生與博士后提供項(xiàng)目實(shí)踐機(jī)會。同時(shí),企業(yè)也要承擔(dān)培訓(xùn)責(zé)任,通過定制化培訓(xùn)計(jì)劃,為有潛質(zhì)的人才搭建跨領(lǐng)域成長橋梁。加快建立跨學(xué)科跨領(lǐng)域合作機(jī)制,鼓勵(lì)人工智能研究人員與基礎(chǔ)科學(xué)領(lǐng)域研究人員、工程師通力合作。

第三,形成多地聯(lián)動、多機(jī)構(gòu)聯(lián)合的工作機(jī)制,推動國內(nèi)機(jī)器化學(xué)家研究團(tuán)隊(duì)進(jìn)行深度合作和共同推廣。加強(qiáng)技術(shù)、工程與科學(xué)的有機(jī)結(jié)合,以機(jī)器為載體、以數(shù)據(jù)為要素,加速擴(kuò)大機(jī)器化學(xué)家智能平臺的規(guī)模,發(fā)展可自主解決科學(xué)難題的強(qiáng)化學(xué)智能,形成針對化學(xué)智能的符號語言與數(shù)據(jù)智能驅(qū)動的科學(xué)方法論。

總之,政府部門應(yīng)針對國際競爭重點(diǎn)領(lǐng)域,加強(qiáng)頂層設(shè)計(jì),集中產(chǎn)學(xué)研多方資源,發(fā)揮機(jī)器化學(xué)家的賦能作用。由產(chǎn)業(yè)部門提供化學(xué)應(yīng)用領(lǐng)域的大量數(shù)據(jù)和應(yīng)用場景,高校和科研機(jī)構(gòu)提出相應(yīng)科學(xué)問題,并提供智力資源,產(chǎn)學(xué)研各方共同助力化學(xué)重點(diǎn)領(lǐng)域的技術(shù)研發(fā)與應(yīng)用。

標(biāo)簽:

相關(guān)閱讀

精彩推薦

相關(guān)詞

推薦閱讀