Google翻译AI开始在两个它从未配对过的语言之间翻译
最近,Google 将其翻译功能切换到了由深度学习算法驱动的翻译人工智能,这让它的翻译更为精准。尤其是在面对那些从未出现过的语言配对时,Google 翻译会更加得心应手。
举个简单的例子,在过去如果一个翻译系统可以进行中日翻译和日英翻译,并不意味着这个系统能很好的进行中英翻译。但现在,通过深度学习的训练,Google 的翻译系统在仅适配中日翻译和日英翻译的情况下,可以很好的学会如何进行中英翻译,并且正确率与人工适配好的中日翻译、日英翻译接近,没有明显下降。
Google 翻译目前为止支持 103 种语言,这意味着将语言两两配对之后会产生 5253 种路径。人工不可能完成所有的配对工作,因此过去在翻译路径上更倾向于将某种语言作为中转语言,而这会导致某些冷门翻译路径的正确率特别低。而深度学习框架让翻译 AI 自己学会了如何翻译没有被教过翻译路径,这使得翻译的争取绿大幅度提升。
研究人员也不能 100% 确定它是如何工作的,因为众所周知深度学习网络是难以理解的。当研究人员将学习完成的数据进行可视化的时候发现,Google 的翻译 AI 会将不同语言的同一词语更准确的分在一组。如果扩大机器学习可用的语言范围,比如将语言总量拓展到 12 种,然后让 Google 翻译其中两种没有被适配过的语言,正确率比仅给 3 种语言更高,但总体正确率依然低于只给两种语言的情况。不过,研究人员称这个正确率已经可以投入实际使用。