虎牙持續創新AI安全應用行業首創直播實時消音係統_國內

虎牙持續創新AI安全應用行業首創直播實時消音係統

發布時間：2022-08-05 09:30:00來源：中國新聞網

　　近日，虎牙直播首創直播實時消音係統上線並已在其平台應用，該係統為(wei) 直播場景中先審後發的“事前防控”提供全麵的監管能力。

　　據悉，目前主流的內(nei) 容安全審核方法是AI+人工審查，這是一種“事後審查”的處理方式。而虎牙開發的這套係統是一種先審後發的技術，基於(yu) 虎牙自研的音頻算法以及多媒體(ti) 加工平台leaf，可以在不增加直播延時的條件下，對直播過程中的違規音頻進行實時消音，有效降低甚至完全阻斷風險內(nei) 容的傳(chuan) 播，實現實時屏蔽、先審後發。“針對AI能力在內(nei) 容風控上的場景應用，我們(men) 優(you) 先選擇了人工審核難度高、效率慢的直播音頻場景上進行應用，下一步，我們(men) 將在直播視頻場景中做出嚐試。”虎牙風控團隊負責人表示。

　　為(wei) 了在直播場景內(nei) 做到無延時，虎牙多巴胺AI技術團隊對語音識別模型以及解碼模塊進行了大量優(you) 化，對每個(ge) 語音片段的解碼能夠達到穩定一致的識別時間。“這很重要，因為(wei) 音頻片段解碼時間的大幅波動，會(hui) 導致違規音頻漏出。在普通的2.1G主頻CPU上，我們(men) 的實時率達到0.08，相當於(yu) 1s音頻隻需要80ms就能識別出來”，虎牙AI消音技術負責人表示。

　　直播場景的複雜性較一般的語音識別場景要大，而複雜場景的識別準確率一直是業(ye) 界難點。“準確率低會(hui) 造成直播的大麵積誤消音，使用戶的體(ti) 驗感降低，召回率低會(hui) 導致漏出違規語音，為(wei) 了得到高召回、高準確率的目標，虎牙多巴胺團隊開發了基於(yu) 直播場景的VAD算法、語音識別算法、後處理算法，同時收集了大量複雜場景的樣本，進行算法迭代優(you) 化，使得我們(men) 在直播這種複雜場景下，也有較高的識別準確率以及召回率。另一方麵，AI模型的優(you) 化仍然依賴樣本校準工作，這是大量的、係統性、長期且細致的。”上述負責人表示。

　　國家互聯網信息辦公室部署開展2022年“清朗”係列專(zhuan) 項行動時指出，此次行動重點針對網絡直播、信息內(nei) 容亂(luan) 象、網絡謠言、未成年網絡環境等10個(ge) 方麵。對每一家互聯網內(nei) 容平台來說，確保平台內(nei) 容的合法性和規範性，健全平台內(nei) 容審核機製成為(wei) 必須重視的問題。

　　資料顯示，虎牙於(yu) 2015年開始研發的“天眼”AI引擎，將人工智能、計算機視覺等前沿技術成果與(yu) 互聯網內(nei) 容安全相結合。該係統可針對不同場景賦能AI能力，實現智能識別(包含音視頻、圖像、文本)和業(ye) 務風控的落地創新，讓傳(chuan) 統的內(nei) 容安全工作更高效、更節省成本，並實現自動化風險預判。此外，“虎牙天眼內(nei) 容安全SaaS解決(jue) 方案”目前已於(yu) 亞(ya) 馬遜雲(yun) 上線，實現了對網絡視聽行業(ye) 的賦能。

　　虎牙直播內(nei) 容風控負責人表示，平台一直深入推進內(nei) 容安全保障工作，采用“AI智能識別、人工審核和網絡誌願者”三位一體(ti) 模式。天眼實時消音係統是平台AI安全應用的一次擴容，平台將打造全方位安全攻防和更精準的內(nei) 容審核體(ti) 係，為(wei) 健康的網絡直播內(nei) 容生態建設提供參考樣本和前沿解決(jue) 方案。

（責編：陳濛濛）

虎牙持續創新AI安全應用行業首創直播實時消音係統

相關閱讀

專題推薦

微觀

賞閱

資料雲

即時新聞

虎牙持續創新AI安全應用 行業首創直播實時消音係統

相關閱讀

專題推薦

微觀

賞閱

資料雲

即時新聞

虎牙持續創新AI安全應用行業首創直播實時消音係統