搜狗发布实时翻译机器,王小川:压力依然很大
蓝鲸TMT(杨博丞)在第三届世界互联网大会上,搜狗公司CEO王小川发表演讲,并首次对外发布了实时机器翻译产品。
在王小川的演讲现场,中外嘉宾座无虚席,许多外国嘉宾头戴同传设备。但很多外国嘉宾却发现,在他演讲的同时,大屏幕字幕上却有这实时翻译功能。
每当王小川讲完一句话之后,其身后屏幕便实时完成了语音和文字转换,该项技术背后主要涉及自然语言理解和处理。
随后,搜狗称,这是全球首次基于神经网络的“实时机器翻译”技术在大型活动上的展示,冒了很大的风险和勇气。但从效果来讲,实时演讲的内容的双语滚动字幕准确性还不错。而此前,在今年6月,王小川在上海便已经推出并展示过。
在接下来的采访中,王小川就本次发布的“实时机器翻译”技术做了进一步解释。
他表示,从无到有的研发过程历时3个月,总体来讲,语音环节是很有难度的,因为语音的错误在翻译和叠加,很容易挂掉。
而今天在现场的发布是首次,王小川在之前并没有做预先的试验,就连他也在捏着一把汗。
说到翻译本身,这套系统的原理架构是先识别中文,而后在将其翻译成英文。至于为何不能同时识别,“因为语音直接到英文中间的语料库是不够的”,王小川讲到。
据王小川讲述,目前搜狗的“实时机器翻译”技术能够做到97%的正确率。而之所以去用语音切入AI,因为语音是第一步,因为它要去识别你的声音,要和你产生交互,同时,可以深度学习。
“而深度学习用来解决语音图像问题很适合,解决文字却很难。文字里唯一能走向实用的东西就是翻译。翻译不是要读懂,只是需要把两段话变过去就可以了,省略中间过程。”
“我们现在用的这套技术,读起来特别流畅,但有可能意思完全不对,完全可能遇到。因为它和AlphaGo第四局棋一样,到它不会的时候是发疯的,可以完全翻成相反的意思,这套翻译技术都有这个问题。”
随后,他向在场媒体演示了今天所发布的这款产品和技术。而现场有记者质疑,是否会和科大讯飞的语音识别技术产生交集,王小川回道,两家公司模式不同,讯飞是to B,而我们是to C,“我认为不会和他们产生多大的竞争。”
对于AI的未来,目前很多人觉得还不是很清晰,而一些创业的小公司却极易遇到种种困难。
“其实我觉得AI这件事互联网小公司挺难弄的,因为AI的核心是数据,没有数据就没法搞,你只能做硬件和芯片这种东西。要么你有核心数据或核心技术,但一般来讲比较靠谱的是升级你的商业,商业上已经跑通了,机器只是把它的效率跑得无比高,纯粹从技术出发做这个事很难的。”王小川如实说。
在他眼中,做硬件你的数据控制力要把握得很好,并且合资来做,往往会轻松许多。
昨天,在互联网大会上,百度CEO李彦宏谈到移动互联网的时代将要过去,并阐述了他对于当前移动互联网的看法。
对此,王小川表示认同,他说:“连接这件事情差不多了,剩下要靠数据驱动,数据中间产生智能。
他给出了两个方向:虚拟体验和商业智能。
首先是虚拟体验。不仅是VR眼镜,但总能带你畅想一个新的世界。我们看小说、看视频、玩游戏都是虚拟体验,这是人性的一部分,人就喜欢玩自己没有经历过的事。
另外一个方向是机器智能或者商业智能。大家在商业社会中由于本身的技术提升,机器开始参与做决策,使得整个社会连接、商业形态里产生更高的效率。
“我们今后的目标是商业智能,并且一定会引入人工智能”。
但王小川觉得,当前的人工智能还存在弱点。首先,它要靠数据驱动,本身并非具有推理功能。有通用学习能力,有人的历史数据用来做复制,仅此而已。
所以,人工智能必须要靠学习是王小川对于AI的总结。“大量数据的学习,不是说一点数据或者推理就能得到结果的,什么事能被机器取代?就是一件事情,人在里面靠经验重复做,这时候机器只要数据大了,就可以取代。”
在大会上,也有来自不同国家的人工智能领域嘉宾。然而,中外在人工智能技术上还存有差异。而在王小川看来,差距巨大。
“我觉得基础研究上差距巨大,包括学校研究出来的,像google的科学家,他们真的能够发明新的算法和新的体系结构来解决人工智能的问题,比如LSPM新算法。而我们基本是看论文,看谁能够最快把论文的这些东西用到我们系统里去。这种研究能力上的差距是巨大的。”
“我们的学校为什么研发不出来呢?因为老师的目标不是真正出成果,而是为了这种怎么去升职,怎么去发论文,怎么去成国家的重点项目,所以它的目标不一样就做不好这件事。”
氛围总的来讲,就是沙漠上滴了两滴水,特别难。
今年,人工智能从年初的人机大战到现在将人工智能应用到各种软件和硬件中去,整个行业的变化还是小有进步。
对于这些变化王小川认为,今年是AI启蒙年,让更多人认识和了解AI,而人工智能真正启蒙运动后的大爆发才刚刚开始。另外,有一些酷炫的东西很酷,但其实智能性或实用性是不够的,真正重要的方向是让机器做准确决策。
而当王小川谈及未来搜狗AI的未来时,他指出,语言上是我们最需要做的,因为我们主业做输入法和搜索都是和文字信息打交道,但文字信息是人工智能里最难的一件事,我们还专注在这件事情上,文字领域的人工智能怎么发展。
最后,对于人们关心的未来是否产生人机大战,王小川笑到,“我不认为机器能把人干掉,创造生命太难了。毕竟人和机器比,人还是太强大了。”