王华树:大数据时代的翻译技术发展及其启示
在大数据时代,数据无所不在,数据激增会导致交流需求的激增,进而促进语言服务需求的激增。大数据技术是一个综合性的技术,它反映了社会的技术性。在技术社会,它的重要特征就是技术因素比较活跃,技术发展和技术创新占主导地位,这将对翻译行业的发展产生不可估量的影响。在语言服务业,许多过去难以量化的信息都将转化为数据进行存储和处理,大量复杂的待翻译项目逐步浮出水面,所以激发并利用隐藏于数据内部尚未被发掘的价值,开拓语言服务业的蓝海是翻译行业的大势所趋。传统的翻译研究者囿于语言和文本的研究,并未充分意识到到当今商业环境中翻译技术发挥的巨大作用,而传统的翻译理论也很难描述和解释现代新型的翻译技术现象和翻译技术活动。无论我们是否做好了准备,大数据时代下的翻译技术发展迅猛,全球范围内翻译研究和翻译教学将发生重大的变化。
一、大数据时代下的语言服务变革
一般认为,语言服务业包括翻译与本地化服务、语言技术工具开发、语言教学与培训、多语信息咨询等四大业务领域。语言服务业的发展离不开海量信息的高速处理,然而,在经济全球化的大背景下,信息呈指数增长,最近两年生成的数据量,相当于此前所有时代人类所生产的数据量总和,知识增长和分化已经远远超出了人类的最大承受范围,所以在信息时代,社会高速发展必须借助信息处理技术。 大数据 计算技术应运而生,解决了数据规模过大,传统计算方式无法在合理时间完成分析处理的技术难题,大数据技术和基于统计方法的自然语言处理技术在语音识别、机器翻译、语义索等技术领域都取得了重大突破性发展(唐智芳,于洋, 2015)。近年来,语言服务和技术市场一直不断发展壮大,市场年增长额逐年递增,从2009年的年增长额为250亿美元到2016年为402.7亿美元。这种变革进而将语言服务业带入了一个全新的信息纪元:语言服务的内容不再局限于口译和笔译,而是随着时间的发展变得日趋多元化。大数据催生出许多新的业务类型,语言服务市场的结构发生了很大的变化:虽然从整体上看,2016年,语言服务业最重要的业务还是传统的笔译和现场口译,二者总市场份额由2013年的57%增至近73%。但是,同2013年相比,语言服务业新出现了会议口译(占3.32%)、手机本地化(占0.51%)、游戏本地化(占0.54%)、搜索引擎优化(占0.35%)和字幕翻译(占1.08%),这些新兴行业市场份额虽小,但是较为稳定。(CSA,2016)。同时,市场愈发多元化使得服务模式也随之产生变化。例如,现在的跨境电商中通常需要实时的多语言交流和翻译,所以即时的、动态的、碎片化的微语言服务模式才登上历史舞台,多元化的语言战略也应该跟上市场的步伐,不断改变。
二、大数据时代下的翻译技术发展
大数据时代,世界是用数据来组成和表达的,我们人类已知的数据还只是冰山一角,尚有很多的数据还未得到充分的挖掘、理解和运用。在面临着海量的、混沌的、非结构化的数据时,要从当中去挖掘更多对特定行业有意义和价值的数据,迫切需要现代语言处理技术。在新技术驱动之下,新兴语言服务市场的重要特征是海量化、多元化、碎片化、多模态、即时性,这些特点更要求语言技术作为基础支撑。在大数据时代,以翻译为例,译文作为产品可以贴上数据标签,诸如原文的诞生、译文生命的延续、译者的风格、译文的版本管理、译文的跨国传播、译文的受众群体、译文的传播效果等诸多因素都可以进行追溯,这些都可以生成一个庞大的翻译数据库,这将对翻译教育和研究产生深远的影响。
随着信息技术的发展,尤其是在近年来在云计算和大数据技术的推动之下,语音识别、翻译技术和翻译平台技术都得到了不断发展。在大数据时代下,语料库资源更加丰富,语音识别技术发展迅速;科大讯飞还开发了语音听写、语音输入法、语音翻译、语音学习、会议听写、舆情监控等智能化语言技术。以SDL为代表的翻译工具开发商也纷纷开发出基于网络的技术写作、翻译记忆、术语管理、语音识别、自动化质量保证、翻译管理等工具,并广泛应用于产业翻译实践之中。计算机辅助翻译软件也取得了重大发展,从单机版走向网络协作、走向云端,从单一的PC平台走向多元化的智能终端。诸如Flitto、TryCan、Onesky等生态整合性的众包翻译平台也受益于大数据技术,蒸蒸日上。以中业科技研发的Trycan翻译平台为例,它依托于互联网大数据,结合语言环境和不同国家的地域等因素,同时依托于中业科技背后数万名在线兼职译员以及多重高级译员审核制度,特别是翻译时间的限制,保证了各种翻译能够在一分钟内得到解决,改变了机器翻译和人工翻译的模式,让翻译更加人性化。
三、大数据时代下的翻译教学
纵观国内翻译技术教学,传统的翻译教学起步相对较早。2006年,教育部批准3所大学开设本科翻译专业(Bachelor of Translation and Interpreting, BTI);2007年,15所高校开设翻译硕士专业学位(Master of Translation and Interpreting, MTI);2011年,158所高校MTI,42所BTI;2012年,159所高校开设MTI,106所BTI;2016年,206所高校开设MTI,230所BTI。翻译人才本应该满足市场需求,但技术的飞速发展要求译者具备更高水平的全方位立体多元化能力,高校输送的人才很难达到 企业 的招聘要求。在此大背景之下,北大MTI在2009年就开始开设翻译技术、本地化建设课程,并在2013年开创语言服务管理方向的先河,现已为企业输送了几批合适的人才,但为数不多的毕业生依然难以满足企业日益增长的人才需求。2014-2015年,北京语言大学、广东外语外贸大学、西安外国语大学等开设本地化方向,旨在培养适应本地化服务市场需要的专业化人才,还有不少高校开始根据当地区域和经济发展的特点,开始和国际化企业开展定制化人才培养的战略。
大数据时代下,机器翻译、计算机辅助翻译技术、智能语音转写和识别技术发展迅猛。翻译技术已经从桌面转变到云端,翻译技术无处不在,语言服务市场不断变化,对人才的需求也不再同于以往。同传统翻译行业相比,现代翻译的对象、形式、流程、手段和所处环境等都发生了巨大的变化,翻译教育也应充分考虑到这种变化,才能培养出可以满足市场需求的人才。在翻译生态环境中,翻译的技术处理包括翻译技术、审校技术、质检技术、管理技术、排版技术等多道工序,与之对应是专业译员、审校人员、质检人员、项目经理和排版专员等多种角色。在该系统模型中,翻译系统的各个技术需求与人才培养系统的职业培养目标相互匹配,要求翻译教学与市场发展必须紧密结合。高校应该先分析市场,设定合理人才培养目标,再调整翻译教学的内容,在课程设置中增加市场急需的翻译技术,定向培养懂翻译、懂技术的语言服务人才。比如,在大数据助力之下,机器翻译技术取得了重大进展。以微软的机器翻译技术为例,在特定领域,利用深层神经网络技术,准确率可维持在80%~90%之间,机器翻译系统预先翻译之后,再进行人工的编辑和审校即可完成翻译,这就是所谓的机器翻译编辑模式。相应地,译员需要知道如何与机器"合作",如何高效地进行译后编辑。那么,这一部分内容就一定要在翻译教学中涉及,这样才能保证高效人才输出与企业需求对接。
此外,翻译技术教学区别于传统的翻译教学,在实施过程中,需要借助现代教育技术和平台(如Moodle课程管理系统、Virtualclass系统以及MOOC教学模式),将现代教育的最新成果融入到翻译技术课程教学之中,推动翻译教学的创新,与时俱进。
四、总结
在大数据时代,翻译技术本质上是数字人文主义下的翻译人文和技术的融合,两者相互影响、相互作用、共生共融。翻译技术是对翻译活动和翻译社会的建构和促进。在新时代背景下下,翻译技术已经构成了翻译从业者不可逃脱的命运,我们应该以开放的心态拥抱新技术的发展,充分认识到技术的人文性和技术性之间的关系,充分发挥现代翻译技术的优势,根据市场的发展与时俱进,调整人才培养战略和教学大纲,培养适应时代发展和市场需求的具备综合素养的现代语言服务人才。
注:原文章来自“《东方翻译》”,作者:王华树,广东外语外贸大学外语研究与协同创新中心教师,本文转自翻译教学与研究,版权著作权属原作者所有。数据观微信公众号(ID:cbdioreview) ,欲了解更多大数据行业相关资讯,可搜索数据观(中国大数据产业观察网www.cbdio.com)进入查看。
责任编辑:王培