新利平台 > 即時新聞 > 時政

從圖書館“搬”到網絡平台 數字技術讓古籍“觸手可及”

發布時間:2023-07-12 09:44:00來源: 人民日報海外版

  輸入網址、輕點鼠標,儒家經典《論語》可逐頁在線閱覽,飄逸俊秀的漢隸代表作《曹全碑》書(shu) 法躍然眼前,古籍還能實現繁體(ti) 字和簡體(ti) 字轉換等功能,讓讀者能查詢、會(hui) 閱讀。專(zhuan) 家認為(wei) ,中華古籍浩如煙海,對珍貴古籍進行保護、修複和活用,關(guan) 乎中華文脈的延續和傳(chuan) 承。隨著數字技術不斷成熟,古籍正走出“深閨高閣”,資源會(hui) 得到更有效利用。

  從(cong) 圖書(shu) 館“搬”到網絡平台

  點擊瀏覽器,進入一個(ge) 名為(wei) “識典古籍”的網站,記者看到《周易》《左傳(chuan) 》《禮記》等典籍陳列在首頁上。隨機點開一本,左側(ce) 為(wei) 章節目錄,右側(ce) 為(wei) 正文,排版形式既符合現代人的閱讀習(xi) 慣,又還原了古籍紙張的閱讀美感。

  這是北京大學數字人文研究中心與(yu) 字節跳動合作研發的一個(ge) 數字古籍平台,自去年10月發布以來,已上線古籍1200餘(yu) 部,免費供公眾(zhong) 瀏覽。

  與(yu) 一些數字化平台僅(jin) 提供古籍影像不同,點擊該平台的功能按鈕,還能實現簡繁體(ti) 轉換、圖文對照、全文檢索、支持移動端等服務。北京大學人工智能研究院副研究員楊浩介紹,該平台應用了文字識別、自動標點等技術,不僅(jin) 將影印本上的文字提取整理,還可以標記文本中的人名、地名等信息。“我們(men) 利用人工智能技術,將古籍由以前的圖像加工成可檢索的文本與(yu) 數據,方便研究者、用戶直接閱讀。”

  隨著數字技術不斷成熟,科技賦能古籍工作取得可喜進展。國家圖書(shu) 館公布的數據顯示,全國已累計在線發布古籍數字資源13萬(wan) 部(件)。打開《永樂(le) 大典》高清影像數據庫(第一輯),讀者能瀏覽到國家圖書(shu) 館館藏的《永樂(le) 大典》40冊(ce) 、75卷的高清圖像及相關(guan) 知識;浙江大學打造的“智慧古籍平台”可在線查閱數萬(wan) 篇古籍,還有著者小傳(chuan) 、人物行跡及社會(hui) 網絡關(guan) 係圖等延伸信息。

  這些古籍是怎樣從(cong) 圖書(shu) 館庫房“搬”到網絡平台的?楊浩介紹,古籍數字化過程分為(wei) 兩(liang) 步。首先將古籍進行掃描。古籍掃描使用專(zhuan) 用非接觸式掃描儀(yi) ,通過高像素照相機,盡量不按壓古籍頁麵進行拍照;采用的光源是防紫外線的LED燈冷光源,減少對古籍的損害。其次是對圖像做數據化處理,利用人工智能技術對文字進行識別,對標點、實體(ti) 等進行標引,方便讀者閱讀與(yu) 檢索。

  減少人工智能識別錯誤率也很重要。字節跳動公益古籍項目相關(guan) 負責人說,具有中文、曆史等專(zhuan) 業(ye) 知識並對古籍感興(xing) 趣的員工,自發成立2600人的誌願者團隊,參與(yu) 古籍校對工作。

  方便讀者獲取資源

  “作為(wei) 再生性保護的重要手段,古籍數字化及其平台建設意義(yi) 重大。”北京大學數字人文中心主任王軍(jun) 認為(wei) ,古籍數字化可以很好地解決(jue) 古籍保護與(yu) 利用之間的矛盾。傳(chuan) 統上,人們(men) 要利用古籍,必須直接接觸書(shu) 籍,這可能導致書(shu) 籍受到進一步磨損,且隻能在特定的圖書(shu) 館或機構中閱讀。通過數字化,不僅(jin) 能減少對古籍的物理損害,還方便讀者隨時隨地獲取這些資源。

  近年來,古籍數字化和平台建設進展很快。國家圖書(shu) 館搭建的“中華古籍資源庫”已成為(wei) 全國古籍資源類型和品種最多、體(ti) 量最大的綜合性資源共享發布平台。中華書(shu) 局的“中華經典古籍庫”已發布6000多種、15億(yi) 字的點校本古籍。一些地方還打造了整理少數民族古籍的數字平台,如“廣西古籍文庫”目前共收錄100多部古壯族文字古籍底本和近千份民族地區文書(shu) 等資源。

  不過,古籍數字化工作依然任重道遠。業(ye) 內(nei) 人士指出,中國現存古籍中,隻有少部分被拍攝成圖像資料,而大部分未實現文本數字化。此外,大量古籍分散收藏在各個(ge) 圖書(shu) 館或收錄於(yu) 不同的數據庫,難以進行高效檢索、關(guan) 聯閱讀和深度挖掘與(yu) 利用。

  如何將這些散落的古籍整合起來?6月初,一個(ge) 旨在對2.5萬(wan) 種古籍進行數字化整理的古籍智慧圖書(shu) 館項目啟動。該項目到2025年底,將實現國家圖書(shu) 館等館藏古籍數字化,並為(wei) 人們(men) 提供公益性閱讀服務。

  短視頻再現古籍裏的美食

  “沒想到古籍這麽(me) ‘香’。”在看完係列短視頻《食光機·隨園私房菜》後,有網友留言說。該短視頻由南京圖書(shu) 館曆史文獻研究館研究員史星宇和韓超製作,他們(men) 按照清代文學家袁枚寫(xie) 的《隨園食單》,再現古籍裏的美食,吸引不少人觀看。

  “為(wei) 了更好地呈現《隨園食單》中的菜品,我們(men) 結合曆史和古代文學等相關(guan) 學科背景,對原文文本一起推敲斟酌,在烹飪上反複試驗,同時盡量還原書(shu) 中的烹飪手法,保證菜品的原汁原味。”韓超說。

  如何讓數字化的古籍和人們(men) 更親(qin) 近呢?這考驗著文保機構、科研院校與(yu) 互聯網公司等相關(guan) 從(cong) 業(ye) 者的創新能力。如紀錄片《古籍尋遊記》運用交互技術、掃描技術等,讓用戶以更沉浸的方式體(ti) 驗甲骨文刻字、建造敦煌莫高窟的過程。

  王軍(jun) 認為(wei) ,在古籍數字化、活化過程中,人文社科學者要積極介入,並加強與(yu) 技術人員合作;高校古典文獻學等相關(guan) 專(zhuan) 業(ye) 應培養(yang) 兼具技術與(yu) 學術能力的複合型人才,部分古籍內(nei) 容應向著“數字文創”轉化,讓古籍更好地走進千家萬(wan) 戶。

  彭訓文

(責編:李雅妮)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。