谷歌翻译无法取代人工翻译,这是它的本质决定的
【腾讯科技编者按】《大西洋月刊》近日发表认知科学家、语言爱好者、翻译家道格拉斯·霍夫萨达特(Douglas Hofstadter)的文章,称谷歌翻译使用的虽然是最先进的人工智能(AI)技术,但测试表明,它翻译语言的水平距离取代人工翻译还差得远。以下为原文内容:
我最初对机器翻译感兴趣是在1970年代中期。近来,由于“深层神经网络”的使用提高了机器翻译的质量,一些人认为,机器翻译在数年内就会取代人工翻译,而翻译人员将会变成质量控制人员和故障修复人员。
谷歌翻译的本质就是绕开对语言的“理解”
谷歌翻译可以很迅速地把A语言翻译为B语言。有人认为,如果一个软件可以如此流畅地对文字进行处理,那么这个软件肯定知道这些文字的意思。这种与AI程序有关的经典幻觉被称为“伊丽莎效应”(eliza effect),因为早在20世纪60年代,就有一个名为伊丽莎的短语生成器假装成心理治疗师,令很多与之互动的人产生了诡异的感觉,好像伊丽莎能深刻地理解了他们内心感受似的。
几十年来,很多聪明人都被伊丽莎效应困住了,就连一些AI研究人员也是如此。谷歌翻译这样的软件其实并不理解词语的意思,不仅如此,谷歌翻译的本质就是绕开对语言的理解。
人类是怎样翻译文章的
对我而言,“翻译”这个词散发着神秘而令人回味的光环。它代表了一种深刻的人性化艺术形式,是将A语言中的思想清晰优雅地转换成B语言中的清晰思想。翻译不仅要做到清晰,还应该保持原作的原汁原味。每当我翻译的时候,我都会先仔细阅读原文,尽可能清晰地理解含义,让它们在我脑海中回荡。让原作中的内容触发各种相关想法的意念,在我脑海中创造出相关场景的丰富“光环”。不用说,这种光环大部分是无意识的。但只有当我的脑海里充满了这种光环时,我才开始尝试用第二种语言来表述它。
简而言之,我并不是简单地把A语言中的单词和短语转换为B语言中的单词和短语。而是在无意识中构建出图像、场景和想法,并用我自己曾经阅读过的,或在电影中看到,或从朋友那里听到的经历来领悟它,只有当这种非语言的、形象的、体验上的、精神上的“光环”出现——只有当原作含义的泡沫飘浮于我的大脑中时——我才开始输出目标语言中的单词和短语,然后修改,修改,再修改。这个以含义为媒介的过程听起来可能不够酷炫,毕竟谷歌翻译每两秒就能翻译一大页,但是任何严肃的翻译人员都是这么做的。
实验用谷歌翻译汉译英
我用谷歌的软件来把几段法文和德文翻译成英文,结果有不少错误。而当我试图用它把中文翻译成英文时,发现效果更糟。我选择的是杨绛在回忆录中写的几段话。
“锺书到清华工作一年后,调任毛选翻译委员会的工作,住在城里,周末回校。 他仍兼管研究生。
毛选翻译委员会的领导是徐永煐同志。介绍锺书做这份工作的是清华同学乔冠华同志。
事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来祝贺。客去后,锺书惶恐地对我说:
他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。
谷歌翻译成的英文有些怪异,首先没有提到“锺书”这个名字,要么直接使用代词he,要么翻译成book。
而且谷歌翻译说锺书是研究生,明明原文写的是他在兼管研究生。
“毛选翻译委员会”也没有翻译对。
“永煐”则变成了“Yongjian”。
至于“南书房行走”,谷歌翻译把它直接翻译成了 “South study walking.”。
(南书房行走,又称南书房翰林。为中国清朝的官衔之一,不属于正式官职,一般由当时的御用知识份子翰林来担任。)
总而言之,谷歌翻译出来的英文虽然都由英语单词组成的,但却不够真正地传达含义,所以你不能说它是英文,它只是英文词语的大杂烩。
有些人可能会觉得我为了挑刺,故意选了一些非常难懂的段落来做实验,实际在绝大多数的段落中,谷歌翻译的效果更好。虽然这听起来好像是那么回事,但情况并非如此。我把我正在读的书中任何一段输入进去,输出的结果都会有大大小小的翻译错误,包括上面例子中那样莫名奇妙的错误。
当然,我也承认谷歌翻译有时会输出一系列看上去很像样的句子(尽管它们可能是误导性的,或完全是错的)。这给你一种错觉,让你觉得谷歌翻译很厉害。不得不说的是,以机器的标准来衡量,它的翻译效果似乎确实还不错。但与此同时,不要忘记伊丽莎效应。谷歌翻译引擎并不是在“阅读”文本,只是在“处理”文本。这个过程与现实经验是分开的,没有记忆,没有意象,没有理解,没有含义。
扩大数据库并不能解决问题
一位朋友问我:如果把谷歌翻译的数据库扩大一百万甚至十亿倍,它可以基本完美地翻译任何东西吗?我不这么认为。拥有更多的“大数据”不会让你理解内容的含义,这个过程涉及到思想,而缺乏思想是当今机器翻译所有问题的根源。所以我觉得,更大的数据库并不是解决问题的关键。
还有人问,谷歌翻译是否可以使用神经网络,让机器开始真正理解语言。这听起来似乎很有前途,但它仍然不是在尝试超越“单词和短语”这个层面。庞大数据库中的各种统计事实都可以体现在神经网络中,但是这些统计数据仅仅是将一个单词与其他单词联系起来,而不是将一个单词与概念联系起来。各种可以被认为是想法、图像、记忆或经验的心理过程,从计算的角度来说仍然是太难捉摸,因此人们用快速而复杂的统计词汇聚类算法来替代它。但是,这种替代品提供的结果,却无法和真正阅读、理解、创造、修改并判断一篇文章的结果相媲美。
尽管如此,谷歌翻译确实为很多人提供了满意的服务:因为只要它翻译的结果中有一部分是可以看懂的,用户就会感到满意了。我个人并不觉得这算是“翻译”,但是对一些人来说,这真的是很好的服务,对他们来说,这就是翻译。他们的要求是这样的,只要达到这个要求,他们就会满意。
如果机器可以重现人类智能
多年以来,我始终认为人脑是一台机器,是一种非常复杂的机器,而且我强烈反对那些说机器本质上不能处理含义的看法。有一些哲学家声称,计算机永远不会“有语义”,因为它们是由“错误的东西”(硅)构成的。我觉得这么说太轻率了。有些读者可能觉得我在本文中就是这个意思。但其实我的意思是,科技并没有试图重现人类智能,而是试图绕过人类智能,结果不如人愿。
我觉得,机器有朝一日可能会拥有创意、趣味、怀旧感、激动、恐惧、狂喜,因此可能高水平地进行翻译。但是,只有当机器像人一样充满想法、情感和经验时才会出现这样的情况。这一天应该还非常遥远,不过至少我怀有这样的期待。
如果有一天,某个翻译引擎用英语创作出一部文艺小说,充满妙语、情感和声律,那我就真的对它五体投地了。(编译/Kathy)