Go to contents

THE DONG-A ILBO Logo

韩国研究团队成功开发出听懂9种语言并自动转换成文字的“多语种语音识别技术”

韩国研究团队成功开发出听懂9种语言并自动转换成文字的“多语种语音识别技术”

Posted April. 19, 2017 07:18,   

Updated April. 19, 2017 07:27

한국어

韩国国内研究团队成功开发出了听懂9种语言并自动转换成文字的“多语种语音识别技术”。预计该技术有望成为可以用于自动翻译、人工智能(AI)秘书、实时电影字幕、无人呼叫中心等多种服务研发的源泉技术。

 韩国电子通信研究院(ETRI)18日表示,金相勋责任研究员等所在的研究团队开发出了与现有的相比进一步提高性能的新的“9种语言识别器。

 语音识别技术目前已经运用于像苹果公司的“Siri”和三星的“BixBy”般的智能手机语音识别服务。但是识别率仅有90%左右,在使用上存在不便之处。此次开发的技术将识别率提高至95%,进一步减少了误差,具有重大的意义。而且该技术还支持英语、韩语、日语、汉语、法语、西班牙语、德语、俄语、阿拉伯语等9种语言。就日常对话水平而言,该语音识别器可以不断进行识别并实时转化成文字。研究团队表示,“就韩语来说,该识别器的性能要比谷歌等世界级企业的语音识别技术更出色,其他语言则处于对等的水平。”

 研究团队利用AI技术之一的“深度学习”技法通过自动分析庞大的语音信息(大数据)的方法提高了语音识别技术的完成度。计划将推出在连接网络的状态下可以使用的“客服服务器型”和能安装在智能手机等便携式终端机上的“搭载型”等两种类型。性能方面客服服务器型更为突出。而搭载型的有的是上即使在断网的地方也可以方便地进行使用。

 ETRI已开始把该技术运用于现有的自动翻译程序“Genie Talk”上进行示范服务。今后计划与平昌冬季奥运会口译/笔译翻译服务领域的官方赞助商韩文和电脑一同参与平昌冬奥会的口译服务。其目标是在2020年东京奥运会举办之前把语言对象扩大到14种,并最终支持20种以上的语言。



田胜珉记者 enhanced@donga.com