Go to contents

THE DONG-A ILBO Logo

韓國研究團隊成功開發出聽懂9種語言並自動轉換成文字的“多語種語音識別技術”

韓國研究團隊成功開發出聽懂9種語言並自動轉換成文字的“多語種語音識別技術”

Posted April. 19, 2017 07:18,   

Updated April. 19, 2017 07:29

한국어

韓國國內研究團隊成功開發出了聽懂9種語言並自動轉換成文字的“多語種語音識別技術”。預計該技術有望成爲可以用于自動翻譯、人工智能(AI)秘書、實時電影字幕、無人呼叫中心等多種服務研發的源泉技術。

 韓國電子通信研究院(ETRI)18日表示,金相勳責任研究員等所在的研究團隊開發出了與現有的相比進一步提高性能的新的“9種語言識別器。

 語音識別技術目前已經運用于像蘋果公司的“Siri”和三星的“BixBy”般的智能手機語音識別服務。但是識別率僅有90%左右,在使用上存在不便之處。此次開發的技術將識別率提高至95%,進一步減少了誤差,具有重大的意義。而且該技術還支持英語、韓語、日語、漢語、法語、西班牙語、德語、俄語、阿拉伯語等9種語言。就日常對話水平而言,該語音識別器可以不斷進行識別並實時轉化成文字。研究團隊表示,“就韓語來說,該識別器的性能要比谷歌等世界級企業的語音識別技術更出色,其他語言則處于對等的水平。”

 研究團隊利用AI技術之一的“深度學習”技法通過自動分析龐大的語音信息(大數據)的方法提高了語音識別技術的完成度。計劃將推出在連接網絡的狀態下可以使用的“客服服務器型”和能安裝在智能手機等便攜式終端機上的“搭載型”等兩種類型。性能方面客服服務器型更爲突出。而搭載型的有的是上即使在斷網的地方也可以方便地進行使用。

 ETRI已開始把該技術運用于現有的自動翻譯程序“Genie Talk”上進行示範服務。今後計劃與平昌冬季奧運會口譯/筆譯翻譯服務領域的官方贊助商韓文和電腦一同參與平昌冬奧會的口譯服務。其目標是在2020年東京奧運會舉辦之前把語言對象擴大到14種,並最終支持20種以上的語言。



田勝珉記者 enhanced@donga.com