新利平台 > 即時新聞 > 國內

在國家智能語音創新中心看民企活力——“創新鏈產業鏈深度融合,步伐更快”

發布時間:2023-05-10 15:53:00來源: 人民日報

  在國家智能語音創新中心看民企活力——

  “創新鏈產(chan) 業(ye) 鏈深度融合,步伐更快”(經濟新方位·支持民營經濟發展)

  企業(ye) 是科技創新的主體(ti) 。習(xi) 近平總書(shu) 記強調:“有能力、有條件的民營企業(ye) 要加強自主創新,在推進科技自立自強和科技成果轉化中發揮更大作用。”

  越來越多的民營企業(ye) 創新步伐不斷加快,成為(wei) 推動經濟高質量發展的重要力量。在安徽合肥,記者走進國家智能語音創新中心。這是工業(ye) 和信息化部2021年批複組建的4家國家製造業(ye) 創新中心之一,由科大訊飛牽頭,依托合肥智能語音創新發展有限公司,國內(nei) 10多家智能語音企業(ye) 和科研院所聯手組建而成。中心與(yu) 企業(ye) 聯動,充分發揮科技創新驅動作用,不斷促進創新鏈產(chan) 業(ye) 鏈深度融合,為(wei) 生產(chan) 生活帶來更多想象空間。

  助生產(chan) 提質增效——

  “智能耳朵”將質檢效率提高2/3

  浙江捷昌線性驅動科技股份有限公司主營電機生產(chan) 。“在傳(chuan) 統工業(ye) 場景中,電機設備一旦出現故障,發出異常聲音,通常都是經驗豐(feng) 富的老師傅用耳朵聽,來判斷故障點。”公司新昌生產(chan) 基地生產(chan) 總監張巍峰介紹:“我們(men) 實現了電機在流水線組裝完成後,通過聲紋質檢係統檢測采集產(chan) 品運轉數據。”

  一款係統,如何通過聲音識別產(chan) 品質量?

  靜音房中,電機運轉,嗡嗡聲響接連不斷;顯示屏上,聲紋起伏,數據被采集捕捉;存在故障,通過數據分析,維修點位隨即可以確定。一直以來,張巍峰都在琢磨怎樣通過機器“聽音”提高質檢效率,“自個(ge) 兒(er) 摸索兩(liang) 三年,沒有取得一點進展”。

  機緣巧合,一次技術推介會(hui) 上,得知國家智能語音創新中心正在開展工業(ye) 聲學方向的研究,張巍峰當即尋求合作:“我們(men) 有需求,他們(men) 懂技術,優(you) 勢互補,說不定能研發出來。”

  研發初期,中心委派的聲紋分析工程師入廠調研,收集樣本;質檢工人現場聽音,記錄特征。6個(ge) 多月時間,采集近5萬(wan) 條數據,算法選型、深度學習(xi) 、參數調節,經過與(yu) 人工聽音多輪比拚試驗,工業(ye) 聲紋質檢係統初步建成。

  國家智能語音創新中心總經理吳江照介紹,利用工業(ye) 聲學技術開展設備質檢,除了民營企業(ye) 自主創新,還離不開科研院所的大力支持。“發聲位置、距離遠近都會(hui) 對收音造成影響,為(wei) 了解決(jue) 工業(ye) 領域的麥克風陣列分布問題,我們(men) 和西北工業(ye) 大學科研團隊開展交流,共同探討技術方案。”吳江照說。

  如今,這款“智能耳朵”已在產(chan) 線投用,質檢識別準確率達到95%。“一次聯合研發,僅(jin) 一條產(chan) 線每年就能為(wei) 我們(men) 節省成本近15萬(wan) 元!”張巍峰算了筆賬,過去人工聽音,易因疲勞而失準,現在使用工業(ye) 聲紋質檢係統,不僅(jin) 效率提高2/3,還增強了一致性。曾經難以分辨的齒輪或換向器故障點,通過聲紋數據分析,有了改進方向。

  讓生活智慧便捷——

  “全屋智控”識別用戶指令更精準精確

  一進門,燈光自動點亮,空調自行開啟;一句語音指令,舒緩的音樂(le) 在耳邊響起,陽台上的晾衣架開始升降;廚房裏,感應裝置監測到煤氣泄漏,既能報警,還會(hui) 開窗……走進合肥榮事達電子電器集團智能全屋體(ti) 驗生活館,研發中心技術人員孫傑指向巴掌大小的控製麵板:“能集中控製空調、音箱、窗簾等,啟動各種智能情景。”

  一塊屏幕,如何實現“全屋智控”?

  從(cong) 傳(chuan) 統的按鍵控製到智能的語音交互,為(wei) 實現多款產(chan) 品集成,孫傑帶領團隊與(yu) 國家智能語音創新中心一道攻關(guan) ,花了約一年時間。

  首先要解決(jue) 的,是用戶反映最多的“免喚醒”功能。孫傑介紹,喚醒詞是為(wei) 了激活設備進入運行狀態,一般來說,喚醒詞說出後,若能立刻給出反應,有利於(yu) 提升用戶體(ti) 驗。可如果每次使用智能設備都需要喚醒詞,也會(hui) 造成交互冗餘(yu) ,增添麻煩。

  為(wei) 此,企業(ye) 結合市場調研,分析常用指令,中心則利用聲學技術,提供算法支持。通過具有AI(人工智能)交互能力的語音芯片加持,這款控製麵板可以實現一分鍾內(nei) “一次喚醒,多輪交互”。

  “誤操作”是橫在麵前的另一道難題。“居家生活時,經常出現閑聊觸發關(guan) 鍵詞、設備作出響應的情況,尤其是在開發‘免喚醒’功能後。”中心AI語音芯片部研發總監周正友介紹。

  是否可以通過識別聲音、判斷方向,進而給出正確回應?為(wei) 了解決(jue) 這個(ge) 難題,周正友和同事們(men) 根據波速強度,算法分析音頻,經過多次試驗,係統識別準確度大幅提升。

  眼下,除了智能家居,這款具有語音交互功能的麵板產(chan) 品還被應用到其他領域。“醫院、養(yang) 老院、辦公室等商用客戶也很感興(xing) 趣!”孫傑表示,企業(ye) 與(yu) 中心聯合攻關(guan) ,既增強了創新能力,還開拓了應用市場。

  為(wei) 創新提供支撐——

  AR字幕眼鏡帶來“看得見的聲音”

  耳邊,交流聲音不斷,眼前,文字逐句呈現。這讓弱聽患者劉爍感覺不錯:“跟看劇一樣!戴上眼鏡,聲音就能轉化成文字顯示在眼前,還可以調節字體(ti) 大小、背景顏色,絲(si) 毫不影響視線。”

  這款AR(增強現實)字幕眼鏡,由北京亮亮視野科技有限公司與(yu) 國家智能語音創新中心聯合研發,具備實時轉寫(xie) 、語音翻譯等功能,已為(wei) 5000多名弱聽患者帶來“看得見的聲音”。

  麵向市場需求,兼具技術基礎,新品研發按說應該很順利。令亮亮視野係統研發部總監趙偉(wei) 沒想到的是,技術遷移並不簡單。“我們(men) 想的是把眼鏡和聲學技術相結合,增強用戶體(ti) 驗,可眼鏡收集聲音後,難以依托眼鏡本體(ti) 算力進行轉寫(xie) 。”趙偉(wei) 思來想去,決(jue) 定“上雲(yun) ”一試。

  這朵“雲(yun) ”,是國家智能語音創新中心構建的端雲(yun) 一體(ti) 語音雲(yun) 平台,為(wei) 金融、醫療、智能交通等領域企業(ye) 提供技術服務,助力企業(ye) 高效穩定運營,日交互量達20億(yi) 次。

  近半年時間裏,趙偉(wei) 在合肥、北京兩(liang) 地奔走,從(cong) 拾音降噪到接入“雲(yun) 端”,企業(ye) 、中心協同創新。如何精準識別人聲?科研人員調節上千次麥克風陣列組合,確定聲音增益最佳範圍。怎樣確保轉寫(xie) 迅速穩定?技術人員將數據接入雲(yun) 平台,提供響應及時的算力支撐。

  “簡化操作步驟、調節字幕位置,產(chan) 品去年研發成功以來,軟件前後更新了三四個(ge) 版本。現在,我們(men) 正在和中心討論,如何增加語音控製開關(guan) 功能,讓用戶操作更加便捷。”趙偉(wei) 說。

  近年來,為(wei) 支持智能語音產(chan) 業(ye) 發展,工信部批複組建國家智能語音創新中心,給予專(zhuan) 項支持;2021年,安徽省印發《支持中國聲穀創新發展若幹政策》,鼓勵人工智能及智能語音產(chan) 業(ye) 發展和推廣應用,引導企業(ye) 協同創新發展。“政府有政策,企業(ye) 有場景、有需求,中心有技術、有實力。依托這樣的創新合作形式,可以更有效實現資源聯動。創新鏈產(chan) 業(ye) 鏈深度融合,步伐更快。”吳江照說。(人民日報)

(責編:陳濛濛)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。