國內大模型實現“長文本”突破
本報訊(記者 孫奇茹)通用人工智能領域初創公司月之暗麵(Moonshot AI)近日宣布在長文本領域實現突破,推出了首個(ge) 支持輸入20萬(wan) 漢字的大模型Moonshot以及搭載該模型的智能助手產(chan) 品Kimi Chat。
從(cong) 技術上看,參數量決(jue) 定了大模型能夠支持多複雜的“計算”,而能夠接收多少文本輸入(即長文本技術)則決(jue) 定了大模型有多大的“內(nei) 存”,兩(liang) 者共同決(jue) 定模型的應用效果。月之暗麵相關(guan) 負責人介紹,支持更長的上下文意味著大模型擁有更大的“內(nei) 存”,從(cong) 而使得大模型的應用更加深入和廣泛:比如通過多篇財報進行市場分析、處理超長的法務合同、快速梳理多篇文章或多個(ge) 網頁的關(guan) 鍵信息、基於(yu) 長篇小說設定進行角色扮演等等,都可以在超長文本技術的加持下,成為(wei) 人們(men) 工作和生活的一部分。
相比當前市麵上以英文為(wei) 基礎訓練的大模型服務,月之暗麵推出的Kimi Chat具備較強的多語言能力。例如,其在中文上具備顯著優(you) 勢,實際使用效果能夠支持約20萬(wan) 漢字的上下文,8倍於(yu) Open AI公司ChatGPT約2.5萬(wan) 字的上下文支持容量。此前,一些大模型僅(jin) 支持數萬(wan) 字的文本量限製使得律師、分析師、谘詢師等需要分析、處理較長文本的工作從(cong) 業(ye) 人員使用相關(guan) AI應用時頗為(wei) 苦惱。根據媒體(ti) 公布的內(nei) 測體(ti) 驗視頻,當上傳(chuan) 一篇長篇小說的電子文檔後,月之暗麵研發的Moonshot能夠清晰地梳理一部小說的主要情節及小說中各個(ge) 主要人物和人物的命運,也可以根據用戶上傳(chuan) 的財報進行關(guan) 鍵數據和公司發展情況的分析等。目前,月之暗麵的智能助手產(chan) 品Kimi Chat已開放內(nei) 測。
今年,中國頂尖AI科研人員之一楊植麟成立月之暗麵。楊植麟此前從(cong) 清華大學畢業(ye) 後前往美國卡內(nei) 基梅隆大學攻讀博士,師從(cong) 蘋果AI研究負責人和穀歌首席科學家。在過去五年內(nei) 的自然語言處理領域,楊植麟的學術論文在華人學者引用排名中位居前10,在40歲以下華人學者中排名第一。(北京日報)
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。