國內大模型實現“長文本”突破_國內

國內大模型實現“長文本”突破

發布時間：2023-10-11 14:56:00來源：北京日報

　　本報訊(記者孫奇茹)通用人工智能領域初創公司月之暗麵(Moonshot AI)近日宣布在長文本領域實現突破，推出了首個(ge) 支持輸入20萬(wan) 漢字的大模型Moonshot以及搭載該模型的智能助手產(chan) 品Kimi Chat。

　　從(cong) 技術上看，參數量決(jue) 定了大模型能夠支持多複雜的“計算”，而能夠接收多少文本輸入(即長文本技術)則決(jue) 定了大模型有多大的“內(nei) 存”，兩(liang) 者共同決(jue) 定模型的應用效果。月之暗麵相關(guan) 負責人介紹，支持更長的上下文意味著大模型擁有更大的“內(nei) 存”，從(cong) 而使得大模型的應用更加深入和廣泛：比如通過多篇財報進行市場分析、處理超長的法務合同、快速梳理多篇文章或多個(ge) 網頁的關(guan) 鍵信息、基於(yu) 長篇小說設定進行角色扮演等等，都可以在超長文本技術的加持下，成為(wei) 人們(men) 工作和生活的一部分。

　　相比當前市麵上以英文為(wei) 基礎訓練的大模型服務，月之暗麵推出的Kimi Chat具備較強的多語言能力。例如，其在中文上具備顯著優(you) 勢，實際使用效果能夠支持約20萬(wan) 漢字的上下文，8倍於(yu) Open AI公司ChatGPT約2.5萬(wan) 字的上下文支持容量。此前，一些大模型僅(jin) 支持數萬(wan) 字的文本量限製使得律師、分析師、谘詢師等需要分析、處理較長文本的工作從(cong) 業(ye) 人員使用相關(guan) AI應用時頗為(wei) 苦惱。根據媒體(ti) 公布的內(nei) 測體(ti) 驗視頻，當上傳(chuan) 一篇長篇小說的電子文檔後，月之暗麵研發的Moonshot能夠清晰地梳理一部小說的主要情節及小說中各個(ge) 主要人物和人物的命運，也可以根據用戶上傳(chuan) 的財報進行關(guan) 鍵數據和公司發展情況的分析等。目前，月之暗麵的智能助手產(chan) 品Kimi Chat已開放內(nei) 測。

　　今年，中國頂尖AI科研人員之一楊植麟成立月之暗麵。楊植麟此前從(cong) 清華大學畢業(ye) 後前往美國卡內(nei) 基梅隆大學攻讀博士，師從(cong) 蘋果AI研究負責人和穀歌首席科學家。在過去五年內(nei) 的自然語言處理領域，楊植麟的學術論文在華人學者引用排名中位居前10，在40歲以下華人學者中排名第一。（北京日報）

（責編：陳濛濛）

國內大模型實現“長文本”突破

相關閱讀

專題推薦

微觀

賞閱

資料雲

即時新聞