新利平台 > 教育

網易有道的95後團隊如何攻下語音識別大獎?

發布時間:2020-10-27 10:24:00來源: 中國網教育

  9月,網易有道詞典官宣了代言人王源,也上線了王源同款“明星語音”功能,10月假期剛過,這支明星語音背後的團隊又低調地拿下了一個(ge) 國際語音大獎,即Interspeech2020口音英語語音識別挑戰賽。

  Interspeech是由國際語音通信協會(hui) ISCA組織的語音研究領域的頂級會(hui) 議之一,今年的賽事吸引了來自全球各地的語音技術研究者,競賽指導委員會(hui) 來自上海交大、南洋理工和美國約翰霍普金斯大學等高校和機構。有道人工智能產(chan) 品部的語音團隊在這屆競賽中獲得二等獎。

  目前,有道在AI領域的布局主要分為(wei) ,自然語言處理(NLP)、圖像識別(OCR)和語音識別與(yu) 合成,其中自然語言處理和圖像識別都是有道的強勢技術領域,為(wei) 有道在互聯網產(chan) 品端做了大量的技術賦能。

  語音團隊是成立時間相對最短,且團隊非常年輕,主要負責這次競賽項目兩(liang) 位團隊成員都是90後,其中一位是95後。

  近年,有道在AI領域斬獲頗多,除了不斷更新迭代的有道詞典筆等硬件產(chan) 品,有道精品課等在線教育業(ye) 務上,也應用了語音識別、口語打分、AI作文批改等智能技術。

  帶著技術基因發展的網易有道,在語音、翻譯等領域已有技術底蘊,技術也推動了有道的內(nei) 容布局。

  以翻譯技術起家的有道,在AI時代攻堅神經網絡翻譯技術(NMT),目前其NMT準確度已達到國際領先水平;AI作文批改曾入選機器之心2020人工智能金煉獎;作為(wei) 王牌技術之一的OCR識別技術,已經能支持26種主流語言文字,是目前國內(nei) 識別語言最多的OCR識別引擎。

  當有道詞典筆逐漸成為(wei) 學習(xi) 場景的“三大件”之一,語音識別技術更加精進。9月推出的王源“明星語音”功能背後,則是有道自主研發的定製語音合成(Text To Speech,簡稱TTS)技術實力。

  孫豔慶談及開發“明星語音”功能時,非常感概團隊的不懈合作。麵對這一群90後、95後同學,他們(men) 有的是貓奴,有的沉迷俄國文學,有的向往技術追星,孫豔慶的團隊要求隻有,活潑且腳踏實地。

  “盡管我們(men) 會(hui) 參加比賽去測試我們(men) 的技術成熟度,但整個(ge) 有道AI團隊更注重給用戶更極致的體(ti) 驗,希望把技術盡快觸達到用戶手裏,獲得好的用戶體(ti) 驗和反饋。”

(責編: 常薇薇)

版權聲明:凡注明“來源:新利平台”或“新利平台文”的所有作品,版權歸高原(北京)文化傳(chuan) 播有限公司。任何媒體(ti) 轉載、摘編、引用,須注明來源新利平台和署著作者名,否則將追究相關(guan) 法律責任。