我國科研人員發布古籍大語言模型
記者日前從(cong) 南京農(nong) 業(ye) 大學了解到,該校信息管理學院王東(dong) 波教授團隊與(yu) 中華書(shu) 局古聯公司研發的古籍大語言模型近日上線。
“我們(men) 請它以‘金陵’為(wei) 主題,生成一首詩。”王東(dong) 波演示模型的智能作詩功能,輸入指令後,模型不久就給出了反饋。除了智能作詩、斷句翻譯,該模型還能實現詞法分析、實體(ti) 識別、關(guan) 係提取、文本摘要等功能。
“普通讀者想閱讀古籍文獻並不容易,要克服繁體(ti) 、豎版、沒有句讀等困難。”王東(dong) 波說,團隊自2013年起為(wei) 《四庫全書(shu) 》等古籍添加人工標注,積累了規模超過20億(yi) 字的精加工語料數據,這為(wei) 該古籍大語言模型提供了語料數據基礎。
據了解,該古籍大語言模型是國家社科基金重大項目“中國古代典籍跨語言知識庫構建及應用研究”的重要成果。下一步,南京農(nong) 業(ye) 大學與(yu) 中華書(shu) 局古聯公司計劃將模型的應用場景推廣到古籍整理、數字文娛等領域。
“期待模型能進一步推動古籍智能化研究與(yu) 跨學科人才培養(yang) 有機結合,讓公眾(zhong) 既能接觸到前沿的人工智能技術,又能積累傳(chuan) 統文化知識。”王東(dong) 波表示。(記者秦華江、陳席元)
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。