谷歌称人工智能让机器翻译水平大增,进步超过去10年总和
文/腾讯科技 俞斯译
拥有18年历史的 谷歌 ( 微博 )正在利用人工智能和机器学习技术给自己的产品进行一次“翻新”和“升级”。
11月17日,这家科技巨头宣布,基于上述技术开发的神经网络机器翻译系统(GNMT:谷歌 Neural Machine Translation),正式被应用到谷歌翻译中。
抛开这个有些晦涩的技术名称,简单来说,它在两方面给谷歌翻译带来了巨大改变。首先,翻译单位由“单词”、“短语”变成了“句子”,能够对整句进行充分理解和翻译;其次,在整句翻译之后,还能够在更广泛的语境中进行调整,找出最相关的语言和词汇,来进行再次调整和安排,最终让翻译出的语言更自然顺畅。
谷歌翻译产品经理Barak Turovsky在视频采访中告诉我们,新的机器翻译错误率减少了55%—85%。目前,35%的在线翻译需求,已经可以使用神经网络机器翻译。
作为谷歌旗下最成功的产品之一,每月有超过5亿人使用谷歌翻译。每天要完成10亿次翻译,涉及的单词量超过1400亿个。庞大的用户量和翻译需求量,使得每一次微小的技术改进都会产生巨大的影响。
“神经网络机器翻译系统是一个重要里程碑,此次更新对谷歌翻译的改进远超过去十年。”谷歌在新闻稿中对于这次技术提升给予了极高评价。今年4月,谷歌刚刚庆祝了谷歌翻译上线十周年。而这次的重大技术更新,也成了工程师们给这款产品最好的一份礼物。
与以往翻译技术的改进不同,这次神经网络机器翻译系统能够像人类一样,拥有自我学习的能力。
根据Barak Turovsky的介绍,机器学习和训练首先需要大量样本,谷歌翻译过去10年积累的海量翻译数据正好提供了这样一个学习的土壤。然后借助TensorFlow开源机器学习平台就可以进行大规模的训练和自我学习,而为了确保翻译的速度,谷歌还专门为机器翻译研发了一款名为TPU的硬件,比世界上现有正在使用的处理翻译的软硬件要快3倍。
目前这项翻译技术已经支持包括英语、法语、德语、西班牙语、葡萄牙语、中文、日语、韩语、土耳其语这八组语言的互译,谷歌接下来的目标就是进一步推广到103种语言,覆盖全球99%的人口。
推荐:关注“AI世代”微信号(tencentAI),回复“麦肯锡”可获得《2030年出行市场会如何?》;回复“创业报告”,可获得美国《AI创业指南》;回复“斯坦福”,可获得《2030年的人工智能与生活》。回复“白宫”,可获得白宫《美国AI战略报告》。