为搅局530亿美元的AI翻译产业,百度搞了一个大动作

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

雷锋网:AI翻译作为人工智能行业可连接数千万个应用场景的服务之一,历来都是「兵家必争之地」。除了国外的谷歌、苹果和微软,国内的BAT、科大讯飞和搜狗也在此展开了激烈竞争。那么,宣布「All in AI」之后的百度,近期在AI翻译产业又有什么大动作?

近日,在日本举行的第16届机器翻译峰会上,百度终于现场展示了一款在传闻中存在很久的智能WiFi翻译机。而这款产品的首次露面,也标志着百度正式加入科大讯飞、分音塔科技等企业开启的AI翻译机大战阵营。

为搅局530亿美元的AI翻译产业,百度搞了一个大动作

图为第16届机器翻译峰会现场

据百度技术委员会吴华现场介绍,这款翻译机可支持中英日等多种语言。在对话时,用户只需选定互译语言种类,按住说话键,翻译机就能智能识别输入语言的语种,且自动输出对应语种的翻译结果。

此外,百度智能翻译机还具有WiFi路由器的功能,可支持80多个国家的移动数据流量,用户开机便能自动连接4G网络,而不用像传统翻译机那样使用APP进行网络配对或插入SIM卡连接网络。雷锋网获悉,百度这款翻译机首先将面向日本和欧美等国旅游或出差的中国人出租或销售,2018年春季将扩大到日本等市场。不过,目前具体上市时间和价格尚不得而知。

在此之前,市面上已经有讯飞的晓译翻译机和分音塔科技的准儿翻译机。晓译翻译机于2016年首次亮相,可支持中英、汉维等多语种翻译。上市售价2999元,主要面向商务和旅游场景需求。就在近日,该款设备上线了中英离线翻译功能。准儿翻译机于2017年5月开始在京东众筹,市场售价1299元,可支持中英日韩泰五个语种互译。据了解,其主要面向境外旅游的需求群体,用户在配合手机APP的情况下,可对菜单路牌宣传册等进行拍照翻译,基本可解决境外旅游常见的语言困境。

相较无人机和扫地机器人,大家对AI翻译机可能并没有那么熟悉。 AI翻译机主要依赖于云端AI技术的支持,核心技术包括语音识别、自然语言理解、机器翻译、语音合成技术等等,并通过深度学习可不断增加翻译语种和提升翻译的精准度。

近两年,随着新一轮人工智能技术的发展,特别是在机器翻译技术上取得的一系列突破,如谷歌去年发布的神经网络机器翻译系统,大大优化了AI翻译在人工译员的思维模式和语法结构的一致性,同时也加速了AI翻译机行业的发展进程。

据科大讯飞发布的2017年中报数据显示,其晓译翻译机在报告期内就已销售近6万台。 科大讯飞人工智能研究员副院长王士进在接受雷锋网采访时也表示,『讯飞晓译在发布之后一度断货』。 而准儿翻译机在京东众筹期间,也实现了600%的预售成绩。这些都力证了该市场的火爆程度。

尽管如此,自AI翻译机推出以来,其还是和其他AI设备一样,遭受了业界一定程度上的「非议」。除了高昂的价格让一部分消费者望而却步之外,一些业界人士认为,AI翻译机现阶段严重依赖网络,离线之后的设备的用户体验不太优秀。同时也有一些人认为,AI翻译机的很多功能非常鸡肋。诸如「翻译」、「查询」、「对讲机」等功能都能通过手机一一实现,那还要翻译机何用?

在综合了网络评价以及业内人士的观点之后,雷锋网也精炼了四个问题,采访了业界和学界的几位大牛。

目前智能翻译机在翻译精准度上表现如何?

在王士进看来,『智能机器翻译机在用户配合时日常口语和旅游简单应用场景已基本达到使用门槛,为人们出国旅行带来很大方便。但在方言、复杂句式和环境噪声严重,以及用户配合度不够的情况下,(翻译)效果还需要继续提升。』

出门问问算法工程师蒋玄罗也认为,『目前(AI翻译机)精准度还可以』。但根据他的观察,其认为翻译机还存在两个难点:

1) 对于口语的识别还不够好。 因为翻译需要大量的平行语料,而大量的平行语料一般都是来自于报纸(比如人民日报)和文学著作等,这里面的说法跟口语表达还是有所差别。

2) 对于实体翻译不好。 AI翻译机更多是针对旅游场景,旅游场景必将面对大量的实体词汇,而机器训练领域和实际使用领域多少存在不一致性,所以实体翻译还是非常具有挑战性。

江苏省人民政府外事办公室副主任黄锡强在接受北京商报采访时表达的看法和蒋玄罗部分一致,其认为,目前来看,人工智能翻译的精准度还有待提高,特别是在文学作品的一些婉转表达上,很难翻译出很多言外之意。

中科院自动化研究所副研究员张家俊则认为,『目前翻译机的精准度需要针对语言和领域来讲,在汉语和英语之间的口语常用对话方面还是非常不错的。不过,如果说话有口音或噪声或者说话时间太长都会有问题,其他语言由于数据的关系可能效果不如汉英,需要提高。』

各公司在AI翻译机上的核心竞争力主要表现在哪一技术上?

王士进向雷锋网 (公众号:雷锋网) 透露,『AI翻译机涉及语音识别、语音合成和机器翻译三个主要组成部分。 现阶段,语音合成技术已经能满足语音信息传达需求,各家最大的技术竞争还是在于语音识别和机器翻译,以及能否联合优化。此外,当前翻译机应用门槛的突破很大程度上还依赖于深度学习的应用, 而深度学习对计算复杂度提出了很高要求,在无网络连接情况下语音识别、翻译、合成怎么实现本地运行,对用户使用便利与否也都非常关键。』

不过,在张家俊看来,『目前AI翻译机在技术方面的核心竞争力基本没有壁垒,主要还是数据、计算性能的优化、语音识别合成翻译的集成以及在硬件方面的设计。』

目前AI翻译机在行业应用上,最大的技术壁垒表现在哪里?

王士进认为,『AI翻译机目前主要应用在口语和旅游等日常交流场景。在行业应用上,首先需要积累较大规模的行业平行数据进行识别和翻译模型自适应训练学习;其次,行业应用一般对翻译效果质量要求更高,例如数字、人名地名、机构名、行业术语等关键信息,如翻译错误,会带来严重影响。所以,就目前而言,如何提高这些信息的识别效果和翻译效果也是需要攻克的难题。』

蒋玄罗告诉雷锋网,『 AI翻译机的核心竞争力在于ASR(Automatic Speech Recognition:自动语音识别)和机器翻译的水平。这两个都是非常高技术壁垒的东西。 当然,从其硬件属性来说,硬件的自我研发能力(或者跟外包硬件公司的协调能力)也是非常重要的。』

而在张家俊看来,其认为『最大的壁垒还是在数据上』。他向雷锋网表示,目前几乎所有翻译技术都是基于数据驱动的,翻译机在语言覆盖度、口音敏感性以及合成的个性化方面都依赖于训练数据。

AI对翻译的颠覆能力,能取代人工翻译吗?

就这一问题,张家俊认为,『人工翻译如果没有创造成分,只是简单的直译和重复,这部分低级的翻译会逐渐受到挑战,但大部分人工翻译是创造性的,无法被AI翻译取代。』

蒋玄罗则向雷锋网表示,这一问题并『 没有非黑即白的答案 』。『在某些特定场景,比如对翻译质量要求不高,或者考虑到没有足够的预算请翻译,AI翻译机确实有其用武之地。』

传神语联网创始人何恩培接受北京商报时表示,外界过高地看待了人工智能对翻译的颠覆能力,取代人工翻译并不是一件明智的事情。

然而,联想到百度CEO李彦宏在今年深圳IT领袖峰会上说的,未来翻译这个职业将会被替代掉,接替者就是人工智能。此番业界和学界的观点更加理性。

雷锋网结语

事实上,对于这些巨头来说,AI翻译机在其整体业务构成中并不占据一个重要位置。但是,在人工智能的发展进程中,AI翻译作为大众最直接使用AI产品和最快速了解AI技术的一种形式,其对于各科技公司的重要性显然不言而喻。

所以,我们也能看到,不论是国内的BATJ、网易、搜狗等大型互联网企业,还是国外的谷歌、微软、苹果、Facebook等科技巨擘,都早在AI翻译领域大有布局。而据相关数据显示,2020年全球翻译产业规模将达530亿美元,如果能进一步实现场景化应用,该产业还将释放更大的潜在需求。同时,结合不断优化的AI技术,AI翻译行业必将迎来红利激增期。届时,吃「蛋糕」的,也就是这些「先行者」了。

为搅局530亿美元的AI翻译产业,百度搞了一个大动作

随意打赏

产业 翻译有道翻译翻译在线百度翻译
提交建议
微信扫一扫,分享给好友吧。