中新網廈門9月17日電 (記者 楊伏山)廈門理工學院智能視聽實驗室團隊15日對外發布“以中文為(wei) 核心的多模態預訓練閩南話語言模型”“閩台視頻資料AI增強與(yu) 編輯雲(yun) 平台”等多項科研成果。
“閩台視聽資料AI超高清視頻增強與(yu) 編輯雲(yun) 平台”是依托人工智能技術實現對視頻資料的智能增強和編輯,用戶可以輕鬆地對視頻進行增強、剪輯、調色等操作,讓視頻更加清晰、鮮豔、逼真。
課題組童同教授介紹說,該平台還支持多種視頻格式和分辨率,滿足不同用戶的需求。
廈門理工學院影視與(yu) 傳(chuan) 播學院副院長、福建省網絡視聽應用創新重點實驗室主任林小勇教授對記者表示,“以中文為(wei) 核心的多模態預訓練閩南話語言模型”采用了最新的深度學習(xi) 技術和大規模語料庫訓練,能夠實現對閩南話的準確理解和生成。
他說,該模型是以中文底層技術為(wei) 核心,以閩南地區閩南話為(wei) 基準音,融合台灣等多地語音,還支持多種模態輸入,如文本、語音、圖像等,可以實現對不同形式的閩南話信息的處理和翻譯。模型的發布,不僅(jin) 為(wei) 全球閩南話使用者的溝通交流有力支持,而且對維護中國語言文化多樣性、增強國際傳(chuan) 播能力具有重要意義(yi) 。
團隊成員、廈門理工學院影視與(yu) 傳(chuan) 播學院副教授黃婉彬認為(wei) ,閩南話使用群體(ti) 達7000萬(wan) 人,使用區域覆蓋閩台兩(liang) 岸、東(dong) 南亞(ya) 與(yu) 海外廣大的華人聚居地,閩南話“大模”是向世界傳(chuan) 播中國文化、加強民間互動交流的重要載體(ti) 。
業(ye) 內(nei) 人士稱,該平台的發布標誌著實驗室的技術水平又向前邁進了一步。基於(yu) 人工智能技術手段,下一步平台將可應用於(yu) 閩台在文化領域的融合發展場景中,對珍貴的閩台曆史影像資料進行融合和修複,並通過新媒體(ti) 在兩(liang) 岸地區傳(chuan) 播,深度挖掘兩(liang) 岸曆史文化共性,助力福建探索海峽兩(liang) 岸融合發展。
天津大學智能與(yu) 計算學部教授熊德意稱,兩(liang) 岸融合示範,語言溝通交流是首要問題,廈門理工學院此次推出的閩南話語言模型和AI增強與(yu) 編輯雲(yun) 平台兩(liang) 個(ge) 成果,猶如兩(liang) 岸融合示範區建設的“新基建”。
廈門理工學院智能視聽實驗室以福建省網絡視聽應用創新重點實驗室等省級平台以依托建設,已獲得國家社科基金項目在內(nei) 的省部級以上重大項目十多項。(完)
版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。