搜狗王小川:机器翻译,我们有信心做得比 Google 更好
只有做了搜索和输入法才知道,英文不好的人太多了。只有做了人工智能才知道,人们不背词典也能看懂世界。
在人工智能领域里,每个参与的人都有各自不同的角色,也就有了很多不同角度的理解。搜狗输入法每天会被用户调用 2 亿次,所以当搜狗思考人工智能的意义时,「照进现实」才是最强的使命感。
在极客公园 GIF2017 的现场,搜狗 CEO 王小川全球首发了他们的新产品「海外搜索」,希望能让搜狗在人工智能领域的积累变成中国互联网用户和英语世界更快连接的工具。
Google 退出了很可惜,但中文和英文的搜索世界依然需要一座「通天塔」。下面是王小川在 GIF2017 大会上的演讲精华整理,看看为什么王小川觉得机器翻译搜狗有信心做得比 Google 更好吧。
我们怎么把这么多学术科研的成果,最后变成我们实实在在能用到的产品?
在一年的时间里,我们学到了太多的词汇,AlphaGO、语音识别、对偶网络、对抗生存网络之类的。但这里我要提个简单的模型,这个模型不仅是人工智能或者计算机使用的,而是对于我们怎么把技术变成产品,再怎么实现商业价值,或者全人类共享价值的。
我们收到的简历上面经常有个词特别高大上,叫「全栈工程师」。就是不仅能写前台,还写后台。而我对自己的理解是需要做一个「全栈的 CEO」。
如果没有技术含量,是很难变成产品的,但是有技术不一定是有产品,不一定有用户规模。有技术、有用户规模,也不一定背后就能带来很大的商业价值,或者是对世界的贡献。
在去年 3 月份,AlphaGO 是一个「黑科技」,但它其实还没法形成用户规模。大家作为好奇者觉得它令人惊艳,但是其实没让你用到。
再往下,有些技术不仅是黑科技,它们开始有了一些用户规模,像语音识别、人脸识别。但这两个技术在我心中,给用户带来实际的变化,还是不够大。
最近我们都在关注无人驾驶领域。这是大家觉得既是黑科技,又会在未来有很大的用户规模,并且有很大的商业价值的领域。但对不起,还没有面世。
从这个维度来讲我们会发现,人工智能变成所有人去追捧的一个热潮,但是并没有找到一个既面世,同时有巨大用户规模,还有巨大改变世界能力的技术。这是我们觉得,最近两三年里应该发生的事情。因此,今天我给大家分享的是,我们在做的一些尝试。
第一件事情,是我们把技术用到搜狗的产品里面去。很多创业公司试图去构造新产品,而我们一个大的逻辑是首先让千家万户用到产品,然后去做升级。
我们现在一天用户规模已经做到了 2 亿次的识别量,同时,一天识别生产的语音数据量大概能到 18 万小时,这是巨大的规模。我们大概用了 400 台 GPU 服务器来支撑这个规模。
全球首发「海外搜索」
我想给大家分享一个《圣经》里面的小故事,这有足够大的意义来阐述,就是关于通天塔的故事。
人类很想通过自己的努力,去构造一座通天塔,能够直接跟上帝对话。上帝觉得那是藐视了他的权威,因此他就让不同的人、不同的民族去说不同的语言。大家说不同语言之后,沟通变成了一个障碍。所以,人类就没有能力去修建通天塔。
如果能够跨语言进行沟通,这个技术的进步犹如人类发明了电一样,是很重要的事情。但如果能做到跨语言的沟通,地球的文明会重新改写,战争会变得更少,不同民族之间的交流会带来一种新文明的产生。所以,这里面我们做了很多的工作。
另外我认为, 我们比 Google 更有动力和决心去做好翻译这件事情 。Google 代表技术的高度,但是它面对的不仅是中文、英文。作为中国人我们是非常有意愿要跟英语世界对话,Google 一做就是上百种语言,或者 8 种语言之间怎么去互译,是一种秀肌肉的事情。
但是,对于世界上最大的一个语言——中文,我们有非常大的动力去把它真正变成现实。这样的动力的驱动下, 我们实际做到的识别准确度是比 Google 更高的 。
今天我想给大家带来的产品,之前一直保密,也是因为极客公园,我们准备在这次活动上发布。我们称之为,搜狗的「海外搜索」。
听到这个词,就一定是跟跨语言的翻译工作相关。它是什么呢?我们在搜索的时候,中文信息可能只占世界信息的 10%,不会更多了。大量优质的内容是在海外,但是 Google 目前在大陆地区无法使用。但即便我们会用 Google,作为一个中国人,我们确实要承认我们的英文水平不够高,用中文搜索的时候没有足够的信息,要英文搜索,可获得英文的答案是很困难的。
因此,今天我们要发布的海外搜索产品,是给中国人用的。帮助英文不够流利,或者效率不够高的朋友。我们实现了当你用中文词输入的时候,能自动翻译成英文,去检索英文世界的内容,同时把它翻译成中文并阅读。
能干嘛用呢?就像我们之前看到的,我们有大量对海外感兴趣的事情,包括专业的词汇,比如「细胞免疫疗法」,在中国很多虚假的信息,这样搜索能看到海外大家是怎么做这件事的。
所以,我们今天首发了这个产品,这是搜狗第一次在极客公园上进行这样的首发,也是全球第一次把深度神经元网络的翻译系统,变成一个完整的跟搜索相关的产品,能够惠及每个中国人。如果单独给你一个翻译产品,大家用起来很费力,但我们把它放在搜索引擎里面去,就能够使得我们有机会搜索全世界的内容。
AI 和我们之间的关系
在这背后,我们还有很多工作要去做。翻译的工作非常细化,有些前沿的词汇并没有做到中文的对应。我昨天从美国回来,查美联航在线值机,但翻译过去再翻译过来,就变成了联合航空在线值机,这里面有很多很多工作需要做透。
做搜索引擎,使得我们有机会很努力地逐步去迭代。同时,我们需要把搜索技术跟网页搜索做到合体。现在是单独的「海外搜索」,之后还要跟网页搜索做整合。同时,再投入更大的机器资源,使大家能全面的浏览,不仅搜索能做翻译,海外的内容能做到完整的中文阅读,翻译之后还能让大家用中文看到整个世界。
所以,翻译技术如果得以解决,我们在想,到底对未来会造成怎样的变化?这也是今天大会的主题。是去取代人类,还是帮助人类?在网上已经开始有了这样的讨论。例如,取代人类?我们的翻译系统,把专业的翻译扔掉了,那这个人群就没有了工作。但是,它对更多人有了帮助。所以,有了机器学习、深度学习之后,机器和人究竟是什么关系?这是我思考的两个结论:
1、我在前年极客公园大会上提到「智慧的体外进化」,有了机器之后,我们要心甘情愿的跟机器合体,把我变成它的一部分。跟机器是融合的,不要孤立看人,离开机器我们会变得更加脆弱。但如果心甘情愿的把机器当成我生命中的一部分,我们会变得更加强。
就像一只猴子,问它「你希望变成人吗?」猴子可能很茫然。同样问一个人,你希望变成一个超人吗?我们可能也很茫然。但是,成为超人的代价,其实是跟机器合体。
2、如果我的工作被取代了会怎样?这几天我在读哲学书,又读到一个尼采的思考。他说,这个地球开始变成一个大的分工,每个人就像螺丝钉一样,做一个局部的事情。比如说,翻译、司机,我们好象找到了一份工作,但其实被限制了自由,我们在社会分工中完成一个原有的精确使命。
但是,当机器开始取代这个精确的分工之后,其实是把我们的束缚解放了,会要求我们做一些更有创造性的事情。没有这种失去,就没有新的获得。
所以我内心里面有一句话,我是愿意做带路党,把机器的智能文明带到人的世界里去。另一方面,我们其实对于每个被分工细化的人有所解放,强迫我们获得一种新的自由,去寻找更多创造性的意义。
这是我想阐述的 AI 和我们之间的关系。