新利平台 > 即時新聞 > 國內

虎牙持續創新AI安全應用 行業首創直播實時消音係統

發布時間:2022-08-05 09:30:00來源: 中國新聞網

  近日,虎牙直播首創直播實時消音係統上線並已在其平台應用,該係統為(wei) 直播場景中先審後發的“事前防控”提供全麵的監管能力。

  據悉,目前主流的內(nei) 容安全審核方法是AI+人工審查,這是一種“事後審查”的處理方式。而虎牙開發的這套係統是一種先審後發的技術,基於(yu) 虎牙自研的音頻算法以及多媒體(ti) 加工平台leaf,可以在不增加直播延時的條件下,對直播過程中的違規音頻進行實時消音,有效降低甚至完全阻斷風險內(nei) 容的傳(chuan) 播,實現實時屏蔽、先審後發。“針對AI能力在內(nei) 容風控上的場景應用,我們(men) 優(you) 先選擇了人工審核難度高、效率慢的直播音頻場景上進行應用,下一步,我們(men) 將在直播視頻場景中做出嚐試。”虎牙風控團隊負責人表示。

  為(wei) 了在直播場景內(nei) 做到無延時,虎牙多巴胺AI技術團隊對語音識別模型以及解碼模塊進行了大量優(you) 化,對每個(ge) 語音片段的解碼能夠達到穩定一致的識別時間。“這很重要,因為(wei) 音頻片段解碼時間的大幅波動,會(hui) 導致違規音頻漏出。在普通的2.1G主頻CPU上,我們(men) 的實時率達到0.08,相當於(yu) 1s音頻隻需要80ms就能識別出來”,虎牙AI消音技術負責人表示。

  直播場景的複雜性較一般的語音識別場景要大,而複雜場景的識別準確率一直是業(ye) 界難點。“準確率低會(hui) 造成直播的大麵積誤消音,使用戶的體(ti) 驗感降低,召回率低會(hui) 導致漏出違規語音,為(wei) 了得到高召回、高準確率的目標,虎牙多巴胺團隊開發了基於(yu) 直播場景的VAD算法、語音識別算法、後處理算法,同時收集了大量複雜場景的樣本,進行算法迭代優(you) 化,使得我們(men) 在直播這種複雜場景下,也有較高的識別準確率以及召回率。另一方麵,AI模型的優(you) 化仍然依賴樣本校準工作,這是大量的、係統性、長期且細致的。”上述負責人表示。

  國家互聯網信息辦公室部署開展2022年“清朗”係列專(zhuan) 項行動時指出,此次行動重點針對網絡直播、信息內(nei) 容亂(luan) 象、網絡謠言、未成年網絡環境等10個(ge) 方麵。對每一家互聯網內(nei) 容平台來說,確保平台內(nei) 容的合法性和規範性,健全平台內(nei) 容審核機製成為(wei) 必須重視的問題。

  資料顯示,虎牙於(yu) 2015年開始研發的“天眼”AI引擎,將人工智能、計算機視覺等前沿技術成果與(yu) 互聯網內(nei) 容安全相結合。該係統可針對不同場景賦能AI能力,實現智能識別(包含音視頻、圖像、文本)和業(ye) 務風控的落地創新,讓傳(chuan) 統的內(nei) 容安全工作更高效、更節省成本,並實現自動化風險預判。此外,“虎牙天眼內(nei) 容安全SaaS解決(jue) 方案”目前已於(yu) 亞(ya) 馬遜雲(yun) 上線,實現了對網絡視聽行業(ye) 的賦能。

  虎牙直播內(nei) 容風控負責人表示,平台一直深入推進內(nei) 容安全保障工作,采用“AI智能識別、人工審核和網絡誌願者”三位一體(ti) 模式。天眼實時消音係統是平台AI安全應用的一次擴容,平台將打造全方位安全攻防和更精準的內(nei) 容審核體(ti) 係,為(wei) 健康的網絡直播內(nei) 容生態建設提供參考樣本和前沿解決(jue) 方案。

(責編: 陳濛濛)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。