easyfundingllc.com
home

中國工程院院士、西藏大學教授尼瑪紮西(中):為西藏搭建信息化橋梁

發布時間: 2024-07-04 09:13:00 來源: www.easyfundingllc.com新聞網

  “祝賀你,你為(wei) 西藏爭(zheng) 得了榮譽。”2023年12月5日,西藏自治區黨(dang) 委書(shu) 記王君正與(yu) 新晉院士尼瑪紮西座談,向他表示祝賀。

  就在2023年11月23日,中國工程院公布了2023年院士增選當選院士名單,尼瑪紮西榜上有名。這是繼多吉院士之後,西藏的第二位工程院院士。

  在2023年當選院士頒證儀(yi) 式上,尼瑪紮西作為(wei) 新當選院士代表登台發言。他深情地說:“我是沐浴著新西藏的陽光雨露,在黨(dang) 和國家的關(guan) 懷培養(yang) 下成長起來的。”

  30多年來,尼瑪紮西傾(qing) 盡所學,回饋著養(yang) 育他的這片大地,為(wei) 西藏搭建信息化橋梁。

  深耕不輟,藏文信息化讓更多的人受益

  本世紀初,手機在全國普及程度已經很高,但對於(yu) 西藏廣大農(nong) 牧民來說,還有些遙不可及。原來,當時價(jia) 格較為(wei) 親(qin) 民的國產(chan) 手機無法支持藏文輸入,能夠支持藏文輸入的進口手機價(jia) 格又讓人望而卻步。

  “藏文的國際編碼標準都是由我們(men) 確立的,我們(men) 沒理由生產(chan) 不出可以支持藏文輸入的國產(chan) 手機。”尼瑪紮西再一次投入到緊張的研發中。

  功夫不負有心人。尼瑪紮西帶領的西藏大學團隊和中國電信西藏分公司等公司共同研發數字移動操作係統藏文版,並推出了基於(yu) 此的藏文數字移動電話,於(yu) 2005年首次實現了手持電子通訊設備的藏文信息處理,受到廣大農(nong) 牧民的歡迎。

  尼瑪紮西並不滿足於(yu) 此。智能手機已經普及,使用藏語文作為(wei) 主要溝通語言的人如何更便捷地使用智能手機?

  2014年,尼瑪紮西團隊與(yu) 中國電信西藏分公司、華為(wei) 集團合作研發智能移動操作係統藏文版——“漢藏安卓操作係統”,並共同推出基於(yu) 此的智能移動電話,用戶可以通過藏文方便地使用移動電話各項功能。這一操作係統之後被廣泛應用於(yu) 我國的國產(chan) 手機中。

  2019年起,尼瑪紮西團隊開始專(zhuan) 注於(yu) 研發國產(chan) 計算機操作係統多語言支撐技術版。2021年,由西藏大學、國防科技大學和麒麟軟件公司曆時18個(ge) 月共同開發的“銀河麒麟操作係統(藏文版)V10”正式發布。尼瑪紮西團隊心無旁騖、馳而不息,深耕藏文信息處理係統技術領域,不斷推出新的研究成果,服務西藏的信息化建設,特別是基層幹部群眾(zhong) 的工作和生活。

  精益求精,藏漢翻譯係統更加“博學”

  在文字信息化過程中,最基礎的工作就是“輸入和輸出”。隨著藏文國際編碼標準的確立,通過尼瑪紮西等一批藏文信息處理專(zhuan) 家的不懈努力,藏文“輸入和輸出”已不再是問題。

  一個(ge) 新的課題擺在了尼瑪紮西麵前,那就是“溝通”。

  “如果一個(ge) 人隻會(hui) 藏文,或者隻會(hui) 普通話,能不能通過機器實現溝通?”想要解決(jue) 這個(ge) 問題,“機器翻譯”成為(wei) 首選。

  尼瑪紮西開始涉獵機器翻譯領域,這對於(yu) 他來說,又是一個(ge) 全新的挑戰。

  2016年,曆時近5年的艱難探索,由尼瑪紮西主持、近30名成員組成的團隊自主研發的“陽光藏漢機器翻譯係統”正式上線,並免費向公眾(zhong) 提供服務,從(cong) 前要花費十幾個(ge) 小時的翻譯工作,通過機器翻譯係統,隻需要十幾分鍾就可以完成。

  想要讓翻譯更加精準,就必須讓係統足夠“博學”。為(wei) 此,尼瑪紮西主持研發了藏文文獻資源數字化平台和全文檢索技術,數字化各類藏文文獻資源,構建了藏文文獻資源庫。

  “這個(ge) 係統就像一個(ge) 牙牙學語的稚童,要不停地教給它各領域各行各業(ye) 的知識,它才可以說出更漂亮的句子來。”尼瑪紮西團隊成員、機器翻譯項目成員仁青東(dong) 主這樣形容“陽光藏漢機器翻譯係統”。

  如今,經過團隊成員的共同努力,“陽光藏漢機器翻譯係統”曆經多次升級,不僅(jin) 將準確率提升至90%以上,係統的最高日訪問量更是達到11萬(wan) 餘(yu) 次。在此基礎上研發的語音翻譯、圖文識別等係列技術和軟件係統將逐步應用於(yu) 社會(hui) 生活的方方麵麵,服務西藏信息化建設和數字經濟發展。

  對於(yu) 尼瑪紮西團隊來說,這些遠遠不夠。

  “藏文是中國文化的瑰寶,已有1300多年的曆史,是世界上古老的文字之一。我們(men) 希望能收錄更多更專(zhuan) 業(ye) 的藏文文獻,讓那些流傳(chuan) 千百年的以藏文承載的文化遺傳(chuan) 得到準確地翻譯。”仁青東(dong) 主說,目前,團隊依然在不斷擴充大規模高質量藏文數據資源,努力提升漢藏機器翻譯係統在藏醫藥、文學和古籍等專(zhuan) 業(ye) 性更強的領域的翻譯準確率。

  攻堅克難,發力藏文古籍文獻數字化

  藏文古籍文獻種類繁多,卷帙浩繁。我國存世藏文古籍總數約在百萬(wan) 函以上,其中,約三分之二收藏於(yu) 西藏。2012年,尼瑪紮西團隊又開拓了全新的領域——藏文古籍文獻深度數字化。

  要想將古籍數字化,最先要攻克的難題就是圖像識別技術。圖像識別可以將藏文文檔圖片識別成計算機可以閱讀的文檔,這樣就有可能利用信息技術對古籍內(nei) 容進行檢索、翻譯、分析和理解等進一步的處理和利用。

  藏文屬於(yu) 拚音文字,字形無定長、無定寬、字符形態變化大。古籍存在版式多樣、圖文混排、結構緊密等現象,不同抄錄人的筆跡、書(shu) 寫(xie) 習(xi) 慣也不盡相同,導致識別難度高,藏文古籍文獻的數字化技術研發和全文數據庫的建設極為(wei) 複雜。

  通過承擔國家重點研發計劃重點專(zhuan) 項,尼瑪紮西帶領團隊應用新一代人工智能技術集智攻關(guan) ,攻克了藏文古籍文獻掃描識別、數字化無損采集、數字化協同工作、全文數據庫構建和檢索等製約藏文古籍文獻數字化保護和利用的係列技術瓶頸,研發了藏文古籍版麵分析與(yu) 多字體(ti) 文字識別係統,工程化應用於(yu) 藏文古籍數字化保護和利用、藏醫藥知識工程技術研發等諸多領域,實現了藏文古籍保護和利用的重要突破。

  2022年,尼瑪紮西團隊“藏文古籍文獻數字化技術研發和應用”榮獲西藏自治區科學技術獎一等獎。

  “目前,研發成果已經在西藏圖書(shu) 館、布達拉宮古籍數字化保護中得到了廣泛應用。”尼瑪紮西團隊成員、西藏大學信息科學技術學院教授擁措介紹說,在該項研發成果的基礎上,團隊還承擔了自治區有關(guan) 圖文識別研究項目,通過利用前沿的人工智能算法,對多場景多字體(ti) 識別技術做了更進一步的研究,包括古籍和其他場景下的多字體(ti) 文字識別技術。

  如今的西藏,信息化高速發展,當選中國工程院院士的尼瑪紮西並沒有停下奮鬥的腳步,他和團隊又把目光瞄準了人工智能領域。“要讓技術賦能民生改善,利用人工智能技術研發語言技術,使農(nong) 牧區群眾(zhong) 在醫院看病、在銀行辦事等社會(hui) 生活中更加方便,使所有人都能感受到國家經濟發展和信息技術進步帶來的便捷生活。”尼瑪紮西說。(記者:湯銘明 索朗群培 康潔白姆 次仁平措 晉巴次成 洛桑平措 對本文亦有貢獻)

(責編: 李雨潼 )

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。

email