中新網北京12月15日電 (記者 孫自法)國際著名學術期刊《自然》最新發表一篇人工智能研究論文稱,研究人員報告了一種方法,他們(men) 利用一個(ge) 大語言模型(LLM)對一個(ge) 著名的數學問題作出了新發現,並通過係統的、迭代的評估框架確保正確。這一方法或可改進LLM用來解決(jue) 問題和學習(xi) 新知識的途徑。
該論文介紹,基於(yu) 人工智能的工具(例如LLM)有望加速科學發現,解決(jue) 長久存在的問題,但它們(men) 有時受製於(yu) “幻覺”,導致作出看似合理但錯誤的陳述。加入一個(ge) 評估步驟,係統地衡量潛在解決(jue) 方案的準確性,使得靠LLM幫助應對複雜問題成為(wei) 可能。這些問題一般需要可驗證且定義(yi) 明確,使這一工具在數學科學中有潛在價(jia) 值。
論文第一作者和通訊作者、Google DeepMind的Bernardino Romera-Paredes和Alhussein Fawzi與(yu) 同事及合作者一起提出一種方法,稱為(wei) FunSearch(因為(wei) 它搜索函數空間),將一組產(chan) 生創造性解決(jue) 方案的LLM和一個(ge) 作為(wei) 檢查者以避免錯誤建議的評估程序結合起來。一個(ge) 多次迭代此過程的演化方法,通過提供此前最佳解決(jue) 辦法作為(wei) 輸入來引導LLM,結果表明這種方法可以收斂到新的、可驗證的正確結果。他們(men) 將FunSearch應用到了著名的上限集問題(cap set problem,數學中涉及計數和排列領域的一個(ge) 中心問題),發現了超越最著名上限集的大上限集新構造。
論文作者認為(wei) ,FunSearch的成功關(guan) 鍵是它會(hui) 尋找描述如何解決(jue) 一個(ge) 問題的程序,而非尋找解決(jue) 辦法。因為(wei) FunSearch的結果是程序,結果易於(yu) 人類解釋和驗證,這意味著該方法有望激發該領域的進一步思考。
他們(men) 補充指出,目前,這個(ge) 方法可能還不適合所有類型的挑戰,但通過未來改進或可使FunSearch應用於(yu) 更大範圍的問題。(完)
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。