在AI科学家、翻译家眼里,谷歌翻译其实没那么神?
采访:加辰
编辑:季星
制图:加辰
欢迎转载,如需授权,请联系微信号:miniDeeperBlue
Google 经历了一个进击的初秋。除了轰轰烈烈浩浩荡荡的秋季发布会,Google 还用它具有重大突破的翻译系统点燃了人们。
《连线》杂志的编辑 Cade Metz 记录了他所经历的一件趣事。今年三月,《连线》编辑部花了一整个月做了 Alapha Go 与李世石人机大战的封面报道,就在杂志下印刷厂之前,编辑部收到了一封激动人心的韩语邮件。
邮件的大意是这样:李世石在与 Alapha Go 败战之后已连赢五场世界顶级对战。正是人工智能将人类推向了新的巅峰。在与 Alapha Go 对弈之后,李世石表示正是机器开发了他对这古老对弈游戏的新理解。
编辑部差不多看懂的时候,当即决定把这一段很好的材料放进文章里去。但难题来了,新闻是用韩语写的,更多的细节需要精密翻译,而编辑部里面没有任何一个人懂韩语。于是,编辑们尝试用 Google 翻译来识别这则新闻,但网页上被翻译出来的英文只有零散的、毫无意义的病句。
没有办法,只好紧急搜罗韩语翻译。“如果我们能够等到新的 Google 翻译就万事大吉了。” Mets 在文中这样写道。这个故事巧合的地方是,正是 Alapha Go 背后的科技—— 深度神经网络 —— 在 Google 翻译中扮演着重要的角色。
深度神经网络仿照人类大脑神经的相互连接系统,与安卓手机指令接收及脸书图像人脸识别系统一样,来自同一种人工智能技术分支。 Google 随后在论文《Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation》上表示, Google 神经机器翻译(GNMT)能够减少 60% 的翻译错误。
目前 Google 神经机器翻译系统已经支持中译英功能,可以看得出来 Google 对于未来的野心与规划。
Google 新的翻译系统用的是深度神经网络中一种叫 LSTM 的技术,即 “长短记忆型递归神经网络(long short-term memory)”。区别于之前的“阶段式机器学习” 翻译,LSTM 可以保持短期与长期的信息,就像人的记忆系统。这使得计算机分析一个句子的时候,在句子结束时仍能够记住开头的内容。
但 LSTM 系统最大的问题就是:慢。对于一个在线服务,要是一句话的翻译得等个一分钟,就不具备用户粘性了。Google 最大的功绩在于,用了许多的算法去改进模型,改进 LSTM 系统。
深度神经网络由层层数理计算(即线性代数)组成,每一层的算法结果都会辅助下一层的计算。谷歌采纳的一种技巧是在第一层完成的时候才启动第二层的计算。
但不少圈内人认为,Google 翻译速度的提升主要是因为拥有了强大的芯片技术支持,指的就是 TPU(Tensor Processing Unit)。有了 TPU,原本要处理 10 秒时间的句子只需要 300 毫秒便可完成。
不仅仅是 Google,所有的互联网巨头都在一个方向上赛跑,战争一触即发。从微软到百度,有能力的选手都入场了。如果说 Google 在芯片上表现卓著,那么微软也在运用其可编程芯片 FPGA 来执行神经网络,而百度正在开发不同类型的硅片。
深蓝 Deeper Blue 今天邀请了 5 位不同领域的代表人来一起聊一聊 Google 神经机器翻译的突破与局限,聊一聊机器翻译的未来。
他们中有来自学界的科研人员,有来自业界的从业人员,还有来自翻译一线的翻译家,虽然领域各自不同,但他们都关注着人工智能对翻译的影响。
1
谷歌发布了谷歌神经机器翻译(GNMT:Google Neural Machine Translation)系统,将机器翻译误差降低了 55%-85% 以上。可以认为谷歌神经机器翻译系统是一项颠覆性的突破吗?
专业翻译对多个语言间翻译结果进行评估,最低分为 0,表示「完全没有意义的翻译」,满分为 6 表示「完美的翻译」。
计算机科学家 孙茂松:早已不是新鲜事
Google 两三年前率先使用这个模型的时候,还是具有革命性的。但现在来看,这就不是新鲜事了,比较恰当的说法是:这是近几年机器翻译领域发展趋势的自然延伸。
事实上,如果我们去看机器翻译领域的顶级国际会议(比如 ACL) ,两三年前都有若干篇论文在使用这个模型做机器翻译。另外,百度早在去年就利用神经网络改进了自己的机器翻译系统。
计算机专家 刘洋:媒体报道有夸张,远不是 “颠覆”。
Google 做的其实是把目前学术界的一些技术集成在一起。Google 本身的数据、运算能力,还有工程师水平都非常高,所以他们通过集成做了一个非常强的系统,这个系统和传统方法相比有比较显著的提高。
但媒体的报道有点夸张,并不能说机器翻译已经接近人的水平,或者完全取代人。Google 这项工作还达不到 “颠覆性突破” 这种程度。
自然语言处理专家 吕正东:工程上更成功的商业化项目。
如果从机器翻译代际更新的角度来看,这确实是一个突破,这次谷歌发布的谷歌神经机器翻译是从统计翻译到神经网络翻译的里程碑式事件。之前,除了百度之外,世界上一直没有一个可以这么大规模生产的翻译系统,而且它在技术上、控制上比百度更完善。
但其实谷歌神经机器翻译最早大概出现在 2014 年底,到现在快两年的时间里,有很多科研工作者都在推动整个技术的发展。Google 做出的这个系统是集成了这两年的很多工作。所以从这个层面来说,它只能被认为是工程上出现的一个能够更好地商业化的项目。
AI 专家、投资人 丁晓诚:
如果说深度学习的成功是一次真正颠覆性的突破,那么这次就不算!
翻译家专家 高兴:“颠覆性突破”,说法有失妥当。
仅凭翻译误差率降低就说它是一项颠覆性突破,显然不妥。误差率降低仅仅是技术改进,算不上颠覆性的突破。
2
机器翻译适用于哪些场景,哪些地方可能可以胜过人类翻译?机器翻译未来会消灭翻译吗?
出境旅机器翻译已经相当普及。
计算机科学家 孙茂松:机器与人,各有优势。
如果是跟专业翻译去比较,那机器翻译在翻译精度上有一定距离。
但在其他一些场景,机器翻译肯定比普通人强。比如,一种我们完全不了解的语言,阿拉伯语,机器翻译这时候就可以为我们提供基本信息。在情报处理领域,机器翻译的优势不可替代。
哪怕与翻译水平较高的专业翻译相比,机器翻译也有一定的长处。专业翻译可能在一般通用领域文本翻译上更出众,但如果换到特定的专业方向上,比如电子通讯领域,专业翻译可能就没法胜任了,而机器翻译在跨方向翻译上有优势。
此外,还有一个显著的好处就是机器翻译速度快。
计算机专家 刘洋:离全自动、高质量翻译还有距离。
机器翻译目前难度还是非常大的,虽然新技术出现了,但是离大家理想中的水平——全自动、高质量翻译,还是有很大距离。所以现在机器翻译主要是用在一些翻译精度要求没有那么高的场合,比如说有的时候只是想了解一下这个网站大意,点一个按钮将阿拉伯文的网页翻译成中文。
自然语言处理专家 吕正东:两种条件下,机器翻译会更成功。
现在的所谓神经网络机器翻译,包括之前的机器翻译都不是基于理解的,也就是说目前的机器翻译没有一个机制是对源语言(即待翻译的语言)有基于语意的表示和理解。
于是,你可以发现在满足这两个条件的情况下,机器翻译比较容易成功:第一是说翻译的两个主体间有意义上比较清晰的对应关系,比如 “北京” 能明确对应 “Beijing”,另一个是说相似结构的句子有出现比较多的样例,比如 “小明喜欢狗” 这类 xx 喜爱xx(xx love/like xx)的结构,无论在中文还是英文里都非常常见。
AI 专家、投资人 丁晓诚:
机器翻译适用于实用文体翻译。机器翻译是机器去学习人类的翻译内容、检索规律并进行效仿,和普通内容的翻译者做的事情是一模一样的,机器翻译将使这部分工作失去必要性。
翻译专家 高兴:简单交流可以,深入灵魂不行。
机器翻译可能适合于旅游、贸易、购物、国际交往中简单沟通等场景。但学术和文学等深刻交流绝对不能指望机器翻译。在某些领域,也许未来会 “消灭翻译”,但在社科人文领域,不太可能。
3
有人认为机器翻译可能会导致翻译腔泛滥、语言匮乏;也有人认为,机器翻译无法完成诗歌、小说等文学性强的内容;除此之外,机器翻译现在还有哪些局限?
热爱工作,工作使其快乐的 Google 翻译也难免犯迷糊。
计算机科学家 孙茂松:机器翻译的强大与局限都来自于模型。
对于文学性强的语言,机器翻译不一定处理得不好。其实机器翻译的原理就是从大量的人工翻译好的语料中去学习训练。如果有大量文学作品给机器,那机器对文学作品的翻译能力也就越强。文学作品中写作风格比较灵活,但只要训练语料里面有充分多的类似语料,机器翻译便可以捕捉到写作模型。
在我看来,机器翻译的强大之处和局限都是因为它所使用的模型:机器并不像人一样真正理解某句话,而是归功于大量的训练。也就是说,机器的翻译知识其实来源于人类,它可以从数以亿计的人类翻译好的文本中学习。这种模型本身并不创造知识,只是把人类的翻译知识放进去,机器想办法学会。
于是这带来了问题。如果你提供的句子,机器没有看到过也没有学习过,可能就处理不好。比如网上网友的测试,让机器翻译一句 “我不想上课”,假设训练语料里面没有类似 “我下课了” 的表述,机器可能会犯糊涂,这就不一定能翻好。总而言之,翻译模型的原理是基于统计的,在训练语料中如果没有出现过,机器就有可能会去猜,于是会出错。
计算机专家 刘洋:最大的难点——如何让机器真正拥有智能
机器翻译的难点其实是整个人工智能的难点——如何让机器真正有智能,像人一样有智能行为。语言翻译是智能行为的一种,还有很多其他类似的行为。现在的计算机模型、方法、数据支持还不足以让计算机真正达到人的智能。
机器翻译现在完全是一个数据驱动的方法,取决于我给计算机提供哪些数据,那么很大的问题就是现在数据比较稀缺。最多的翻译数据来自于政府文档,比如联合国有多种官方语言,每出一个文件都会有多语种版本。而有的领域基本没有数据,比如娱乐、体育,因为我们不可能把网上每一篇体育新闻都翻译成另一种语言。
至于文学类型的翻译,倒不是说机器一定翻不好,而是大家暂时觉得没有商用价值,所有受关注不高。商用价值比较高的,像专利、旅游、法律文书、专业手册这类。机器翻译的应用比较多。
自然语言处理专家 吕正东:更多的数据或许可以弥补缺憾。
到具体的应用场景上,机器翻译不太能成功的地方可能会在:需要对句子的引申含义进行翻译;翻译要求较高的场景,比如对文学作品的翻译;还有就是对于逻辑非常复杂的句子,机器翻译很难搞定,因为它的原理不是基于理解,而是利用某种意义上待翻译语言和目标语言的对齐。
其实所有上述问题,理论上来说都可以靠更多的数据来弥补,但是我们数据是有限的。
AI 专家、投资人 丁晓诚:机器不能替代人产生情感与好恶。
机器翻译的优势是对字面结构在统计意义上的发现、模仿、对应变换能力,其局限是不理解字面背后的意思,对特定场景的适应能力会有不足(而人类不仅仅认识语言,还理解意思)。
机器无法理解翻译的语言背后的意义,它不能代替人产生情感与好恶,从而产生对文字的意义上的判断(机器没有人的认知意义上的 “理解力” 与 “判断力”)。虽然机器翻译依然最终能够相当好的解决绝大部分实用文本翻译,但不能胜任真正具有创造性的工作,比如诗歌的翻译。
翻译专家 高兴:创造、创作,机器还无法胜任。
机器翻译肯定不能替代文学艺术翻译。文学艺术翻译要体现情感、色彩、语调、温度、韵致、字里行间的意味等种种幽微之处。要传达出这些,译者的水准、敏感、境界和心灵力量尤为重要。此外,文学艺术在某种程度上就是创造,就是打破常规。而这些恰恰是标准化、程序化和统一化的机器翻译难以适应、难以做到的。
4
机器翻译未来可能在哪些地方取得突破?
关于机器翻译,还有很多值得想象。
计算机科学家 孙茂松:稀有语言翻译难度较大,值得关注。
现在对某些训练语料很少的语言,机器翻译甚至可能完全不能用,比如说汉语-维吾尔语,维吾尔语-藏语。世界语言好几千种,几千种之间的互译,其中绝大多数语言之间都没有足够语料。所以这方面的翻译还有很多工作需要去做,包括一些模型的探索。
计算机专家 刘洋:和 “知识” 深度结合。
最近二十年,机器翻译的发展趋势是数据驱动,从大量互联网文本中自动学习,主要还是受机器学习、人工智能整体潮流的影响,所使用的很多方法都是机器学习领域的。
我个人认为,未来,机器翻译应该和更多的 “知识” 联合在一起,和一些知识图谱,知识库相结合,因为现在主要都是从数据文本中学习,缺乏知识上的智能。
另外,现在机器翻译并没有和认知、脑科学结合起来,纯粹是一个数学方法。机器翻译是一个交叉学科,取决于很多方向的进展:数学、语言学、计算机科学、神经认知科学、工程学,每个学科的发展都有可能推动它向前走。
自然语言处理专家 吕正东:
未来我觉得机器翻译要做好的事情,是对于某些出现频率不那么高的词、句的处理上。这些词、句对人来说是很容易掌握的,但对机器翻译的特点来说,需要它们重复/出现足够多次才能学习到。这是一个需要去突破的地方,而且我相信能比较快取得突破的地方,因为这在商业上有很强的需求。
而比较难突破的地方,我觉得是语言中那些委婉的对应关系,和不规范的地方。因为不规范,某种意义上对应着例外,我们可能会需要相当长的时间才能搞定,需要真正去理解语意,这是非常非常困难的任务。
AI 专家、投资人 丁晓诚:
机器翻译会更好的解决 “常规问题”,把陈词滥调翻译得更流畅,比如混合语言(比如中文、英文、符号夹杂)、混合通道(比如文字、语音切换)的翻译。
翻译专家 高兴:
我想机器翻译未来主要会在日常生活中取得突破,会明显地改变日常生活的面貌。
深蓝本期专家介绍:
孙茂松 清华大学计算机系教授,前系主任
国家 973 计划项目首席科学家,国家社会科学基金重大项目首席专家。研究方向为自然语言理解、社会计算等。他曾主持完成信息处理用分词国际标准2项,在自然语言处理和人工智能领域重要国际刊物 Computational Linguistics 和会议 ACL 等上发表论文数十篇。
刘洋,清华大学计算机系副研究员
研究方向为自然语言处理,机器翻译。在自然语言处理和人工智能领域重要国际刊物 Computational Linguistics 和会议 ACL 等上发表论文 40 余篇。
吕正东,华为诺亚方舟实验室资深研究员
领导自然语言处理中的深度学习研究项目,研究方向研究方向包括机器学习,自然语言处理,深度学习及数据挖掘。他曾任得克萨斯大学奥斯汀分校博士后研究员,微软亚洲研究院副研究员。目前,吕正东博士已发表 30 多篇顶级会议和期刊论文,并且长期担任多个国际会议(NIPS, ICML和IEEE transaction on PAMI)的审稿人。
丁晓诚,创客总部兼职合伙人
专注于智能服务与机器人产业的研究、咨询、孵化、投资。他曾参与创办 Face++,研发世界级照片/视频人脸识别云引擎。丁晓诚拥有北京大学计算机硕士学位,毕业后历任IBM、中国移动、百度、Symbian、惠普等公司技术研发与产品管理工作。
高兴,著名翻译家。
现任中国社会科学院外国文学研究所编审,《世界文学》主编。参与过米兰昆德拉、索勒斯库等国外文学家专辑作品的编辑,发表过1百多万字及数百首诗歌的翻译,代表翻译作品有《凡高》、《安娜·布兰迪亚娜诗选》、《我的初恋》、《搭车游戏》、《野姑娘》。