新利平台 > 即時新聞 > 國內

機器化學家誕生記:中國團隊曆時8年打造“最強化學大腦”

發布時間:2022-10-17 11:10:00來源: 中國青年報

  零距離

  中國團隊曆時8年打造“最強化學大腦”

  機器化學家誕生記

  在中國科學技術大學的機器化學家實驗室,可以看見頗具科技感的一幕——一個(ge) 體(ti) 型“敦實”但動作靈活的機器人,在操作台之間穿梭,伸出機械手臂配製試劑。實驗室另一邊,年輕科研人員正輸入指令,對機器人進行“隔空”控製。大部分情況下,這台機器人會(hui) 自主思考實驗的步驟和方案,像個(ge) 不知疲憊的“小化學家”。

  這是中國科學技術大學化學物理係教授江俊團隊的“作品”,該團隊開發了全球首個(ge) 集閱讀文獻、自主設計實驗、覆蓋材料開發全流程的機器化學家平台,從(cong) 數以億(yi) 計的可能組合中找到最優(you) 解來加快材料研發。“實驗數據經處理後,輸入到平台獨有的計算大腦中,產(chan) 生理實交融的人工智能模型,幫助科研人員優(you) 化實驗方案。”江俊說。

  江俊團隊有近30位成員,其中多數是90後、95後。10月上旬,團隊又添科研進展——通過開發和集成移動機器人、化學工作站、智能操作係統、科學數據庫,他們(men) 研製出數據智能驅動的全流程機器化學家。

  該研究成果論文已在最新一期《國家科學評論》學術期刊發表。國際審稿人評價(jia) 說,該成果的“機器人係統、工作站和智能化學大腦都是最先進的”“將對化學科學產(chan) 生巨大影響”。業(ye) 內(nei) 專(zhuan) 家認為(wei) ,機器化學家的研究工作脫離了傳(chuan) 統試錯研究範式的限製,展現出“最強化學大腦”指導的智能新範式的巨大優(you) 勢,引領化學研究朝著知識理解數字化、操作指令化、創製模板化的未來趨勢前進。

  那麽(me) ,一個(ge) “聰明”到會(hui) 做化學實驗的機器人是如何誕生的,其背後凝聚了年輕人怎樣的努力和心血?中青報·中青網記者進行了采訪。

  “打造中國人自己的材料數據庫”

  隨著化學研究的對象日益複雜化、高維化,傳(chuan) 統研究範式成本高、周期跨度長的問題日益突出。近年來,科技界逐漸意識到數據對於(yu) 學術研究和產(chan) 業(ye) 創新發展的重要意義(yi) ,而大數據科學與(yu) 人工智能技術結合的手段,也在先進材料研發中嶄露頭角。

  團隊核心成員肖恒宇是1995年生人,他本科就讀於(yu) 中國科學技術大學少年班學院,出於(yu) 興(xing) 趣自學了人工智能。一次,他編寫(xie) 的一個(ge) 智能程序出現問題,於(yu) 是向時任班主任的江俊請教。江俊一針見血地指出,“算法沒有問題,但算法依賴的實驗數據過於(yu) 片麵”。

  江俊發現,一段時間以來,我國科研團隊會(hui) 將科研數據寫(xie) 進英文論文,在國外期刊上發表,但等到要引用數據時,還得額外花錢去買(mai) 。

  “做中國人自己的材料數據庫”,成了江俊的夢想。在他的影響下,肖恒宇等人一起踏上實現這個(ge) 夢想的道路。

  肖恒宇的同學霍姚遠、馮(feng) 超,學的是數學和化學,喜歡研究數據。2014年開始,三人收集數據、挖掘文獻、尋找架構,江俊提供原理指導和研究資源。2016年,他們(men) 搭建了第一代材料數據檢索平台,但使用反饋不太理想,有老師抱怨“數據不準確”。

  肖恒宇等人意識到,數據不僅(jin) 要多,還要優(you) 質。他們(men) 的數據庫缺了最重要的一環——知識圖譜,這導致數據質量良莠不齊,無法進行高效檢索。

  建立知識圖譜並非易事,同學們(men) 要用專(zhuan) 業(ye) 知識區分數據的關(guan) 聯性,為(wei) 圖像打上識別標簽,讓電腦知道每個(ge) 數據背後的物理意義(yi) 。

  團隊成員、博士生張百成記得,最初全靠幾位同學自己“打標簽”,沒日沒夜地標注了幾個(ge) 星期,大家讀文獻讀得頭昏腦漲,卻隻完成了任務量的1%,幾近絕望。

  為(wei) 此,江俊找到中國科大校團委,開展有獎讀文獻比賽,聯合更多有專(zhuan) 業(ye) 背景的大學生參與(yu) 。由此,他們(men) 產(chan) 生了第一批高質量的標記數據。

  “眾(zhong) 人拾柴火焰高,大數據時代,要融合眾(zhong) 智、整合資源。”張百成說,利用這批數據訓練智能算法,他們(men) 實現了第一代化學命名實體(ti) 識別程序,後續的標注任務,可以先讓計算機自動識別,再進行人工檢驗,極大提升了效率。

  最終,他們(men) 打磨出我國第一代材料科學知識圖譜。2021年,團隊用圖譜賦予機器人“小來”科學思維,團隊的自然語言處理技術也隨之“鳥槍換炮”,機器自動閱讀和識別的準確度提高到90%。

  “將數據變為(wei) 實際生產(chan) 力”

  2016年,肖恒宇參加互聯網+創新創業(ye) 大賽,獲安徽省冠軍(jun) 、全國銀獎。投資機構為(wei) 他和團隊提供第一筆創業(ye) 資金。成立公司後,團隊3次迭代知識圖譜,建立了含9000萬(wan) 個(ge) 化合物、1100萬(wan) 條化學反應路徑的大規模材料數據庫。團隊還借此幫助一些科研單位解決(jue) 技術難題。

  譬如,某航天企業(ye) 發現組合發動機中的金屬配件材料需要改進,嚐試多種方案都未能實現。肖恒宇等人用數據平台模擬出燃燒流場、大渦流場,並找到記憶金屬設計配方,這為(wei) 該企業(ye) 節省成本4300多萬(wan) 元。

  肖恒宇團隊還迎來了意外之喜——他們(men) 在為(wei) 該企業(ye) 解決(jue) 問題的過程中,收集了10萬(wan) 種合金演化結構數據和金屬原子間相互作用能數據,這些反過來豐(feng) 富和完善了他們(men) 已有的數據庫平台體(ti) 係。

  “以往做研究時,有人習(xi) 慣將數值往自己想要的方向去調整,但是研究需要數據多樣性,要記錄偏見、有誤差的數據。”江俊堅信,數據是科研和產(chan) 業(ye) 的共同語言,數據庫平台就是連接科研與(yu) 產(chan) 業(ye) 的橋梁,要產(chan) 生更多高標準的數據反哺科研,將數據變為(wei) 實際生產(chan) 力。

  目前,該團隊又建立了材料基因創新研究平台,建成亞(ya) 洲最大的材料數據庫平台——機數大材庫。

  江俊介紹,機器化學家平台具有更強的化學智能和廣泛的新材料開發能力,涵蓋光催化與(yu) 電催化材料、發光分子、光學薄膜材料等領域,適用範圍將隨平台升級和拓展繼續擴大。

  “從(cong) 不擺爛,從(cong) 不應付交差”

  每周開組會(hui) 時,江俊隻需要提出希望機器人解決(jue) 的問題,學生們(men) 就會(hui) 自己討論實施方案。設備沒有底層驅動程序,學生們(men) 就會(hui) 攻關(guan) 智能化升級。再後來開會(hui) 時,江俊隻能坐在一旁聽著,甚至插不上話。

  讓他欣慰的是,幾位有交叉學科背景的年輕在讀博士,已經成長為(wei) 團隊“頂梁柱”:肖恒宇設計軟件框架;張百成編寫(xie) 程序,讓機器人讀論文、提出科學假設、形成實驗報告和方案;趙路遠主攻電化學測試,負責烘幹儀(yi) 器、光譜儀(yi) 等硬件的驅動程序開發。

  25歲的趙路遠學電子科學技術出身。在她看來,克服科研難題主要靠毅力。她和師弟曹嘉祺一起編寫(xie) 某驅動程序時,由於(yu) 信息掌握不充足,無法準確理解調用接口,“我們(men) 反複聯係儀(yi) 器廠商和代理商,沒有回應。我們(men) 決(jue) 定自力更生。”

  3周時間,兩(liang) 人就像兩(liang) 個(ge) 機器人,除了吃飯睡覺外,重複做了3000次發送信號、等待反饋、記錄響應等嚐試,一點一點逆向試出了底層控製邏輯,成功實現了對機器人的遠程控製。

  “此時,儀(yi) 器代理商主動找到我們(men) ,想要購買(mai) 我們(men) 的驅動程序,我們(men) 覺得特別自豪。”趙路遠說。

  2021年,團隊信心滿滿地開始機器人的首次試運行,不料,化學設備單獨運行正常,但參與(yu) 係統聯調時卻無法使用。大家排查到半夜仍然沒有頭緒。

  這時,肖恒宇突然意識到化學設備和機械臂均使用了紅外探測設備,可能會(hui) 互相幹擾。於(yu) 是,他將機械臂換一個(ge) 朝向,輕鬆解決(jue) 了問題。

  “往後的開發調試中,不同領域的儀(yi) 器設備,不同係統的代碼協議間,都出現了類似的 ‘磨合’難題,而我們(men) 通過交叉學科思維,將它們(men) 逐一擊破。”肖恒宇說。

  “一個(ge) 方案受挫,大家不會(hui) 擺爛,不會(hui) 應付交差,而是反複測試,看看究竟哪個(ge) 環節出了問題。”肖恒宇說,科研夥(huo) 伴身上有著相似特質——對流程和技術的執著。完成任務時,團隊成員總會(hui) 想的比自己更多一點,不僅(jin) 拿出方案,還會(hui) 想好替代方案和若幹發散選項。

  在他看來,從(cong) 開發測試,到改進迭代,再到升級,一個(ge) 實驗分支由一人全部負責,每個(ge) 人都成長為(wei) “全能人才”。肖恒宇說,全身心投入科研時,所有知識都有用武之地。他一直自學3D動畫。課題組拍攝科普片時,他還包辦了分鏡頭和腳本撰寫(xie) 。

  肖恒宇曾在寧夏回族自治區海原縣一中支教。他利用閑置的傳(chuan) 感器等儀(yi) 器,搭建了兩(liang) 個(ge) 小型實驗室,帶學生學化學、物理、信息,激發孩子們(men) 的科學興(xing) 趣。他一直有個(ge) 夢想,希望帶動更多年輕人合作研發更高水平、更具科研智慧的實驗平台,讓中國的智能化學閃耀世界。

  中青報·中青網記者 王海涵 王磊 (來源:中國青年報)

(責編:陳濛濛)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。