为人工智能投入重金的王小川如何看待 AI 那些事?
今年 5 月 7 日,一位名叫 Joshua D. Brown 的美国俄亥俄州白人男子成为了第一位死于自动驾驶技术的人,而Tesla 和人工智能技术再一次走向了评论的风口浪尖。
过去一年,你可能已经见过或听过各种以「人工智能」为噱头包装的公司,随着「人机大战」带来的持续讨论,「人工智能」似乎也成为了企业争相抢夺的未来入口。
除了「机器学习」、「模式识别」和「神经网络」这些晦涩的词汇和各种层出不穷的借势营销,这个看似离我们越来越近的市场却在「互联网玄学」的外衣下显得愈发迷雾重重。
在外界普遍认为的人工智能元年里,我们看到更多的是初创型企业的活跃,尽管危机重重的百度已经将发展重心重新回归到人工智能,腾讯和阿里也相继计划建立各自的 AI 研究体系,但产业内关键性力量的缺失也成为了一些评论家质疑市场可行性的口实。
但搜狗 CEO 王小川肯定算是这其中的「异类」。近几年,在搜索、输入法和地图等业务上稳步发展的同时,面对人工智能浪潮的王小川似乎是 AI 技术的最坚定站台者。在出资 1.8 亿元联合清华大学成立「天工研究院」后,这家以搜索和工具起家的公司更是将未来和人工智能紧密地结合在了一起。
事实上,从搜索、输入法、地图到语音助手,「人工智能」的基因似乎扎根于每一件搜狗想做的事。而在王小川眼里,搜索引擎公司是人工智能基因最足的模式,拥有了这一基因的搜狗将怎样让人工智能技术更好地与产品应用相结合?王小川又如何看待有关 AI 的那些事儿?
人工智能与人并非对立
「这是我觉得近几年最懊恼的一次。」
去年年初,搜狗CEO王小川已经开始意识到了深度学习技术有机会应用于围棋博弈,但限于资源、精力,一直没有在内外部找到合适的机会来启动这个项目。
直到 AlphaGo 相关的论文出现,王小川才万分后悔懊恼,于是在 AlphaGo 和李世乭的比赛中,花了较多时间去参与技术的解读和现场直播解说,但也可能只是「弥补了 10%,还是有很大的遗憾。」
「一方面是自己本身有这样一个信仰,然后一看谷歌已经走在前面了,我也相信它的技术实力,也就是 80% 是对技术的理解,20% 是对谷歌和人工智能情怀的认同。」
王小川并不认为在未来人类和人工智能的关系是「对立」的,他还是认为机器更多的是对人类的一种辅助,而且强调这种辅助早已存在,「机器可能不是一个机器人的形态,大家现在手机里或者各种智能家居都是机器的表现之一。」人工智能的大趋势是和人实现融合。
当然,对于机器取代人的话题,王小川的判断是:「如果同样一件事情,机器干得比人好,那人就会被机器取代,这是规律和趋势。」
但是,人工智能并非将要替代人类,而是人类未来的发展方向,如同今天的机械工具一样,最终将成为人类能力的延伸。
「只有忘却恐惧,我们才能进步与觉醒,在我们建造的世界里,让生活更加美好。」
Google 在收购 DeepMind 团队之前,双方曾签署了一份协议,协议规定双方不得以 DeepMind 的技术进入到军事和监控等领域;同时,他们还成立了九席的道德委员会,其中,Google 和 DeepMind 团队各占三席,另外的三席由独立的倒是占据,这其中就包括曾对人工智能发表过隐忧言论的 Elon Musk。
王小川就觉得这是一个非常好的风险防控机制,并且人工智能带来的正面意义要远大于他所带来的危险。
在机器是否会取代人这个问题上,一项工作如果面临的环境越简单,最后的动作越标准,比如审计师、司机,就越有可能被机器取代。但其实还有很多机器解决不了的问题,比如:创造力的问题、认知上的问题、人的好奇心的问题。人工智能到今天为止还只是帮助完成简单的重复性的脑力劳动,更加具有挑战性、更有创造性的事情还需要人类来完成。
交互和索引是未来的挑战
「在用户需求的场景下,未来会面临两个挑战:第一是自然交互的技术进步,包括图像及语音。第二是知识的索引,更好地与搜索结合。」
在图像处理领域,以人脸识别为例:每个人的脸长什么样子,使用程序去描述是非常困难的,而深度学习的方法,在建立一套数学模型之后,只要把人脸照片放进去,告诉计算机这张照片对应的名字是什么,在大量数据的基础上,它就能开始自动提取特征,把复杂的物理图片抽象成机器智能懂得的特征。
在语音识别领域中,到今天为止机器对语音的识别能力也已经开始接近于人。输入方式也可能会越来越自然。比如说语音输入开始了,以后你的表情,你的手势,甚至通过数据分析对你的理解,都能够让机器懂你要什么,而不是打字的方式了,甚至脑电波都有可能。
而在搜索领域中,之前搜索引擎是让你获得知识和答案,但这还是一种初级的形态:你需要给它一个关健词,然后它从数百亿网页里面找十条最好的给你。但是随着人工智能的发展,这个产品形态会发生变化:机器开始具有对概念理解的能力,知道你实际需要什么,然后通过计算给你一个它认为正确的答案,而不是单纯的十条链接。
「输入法朝着交互技术在走。所以以后一方面,输入法输入的不仅仅是文字了,我们语音已经做了,以后你的视觉、你的表情、你的眼神、你的手势也变成输入的一部分,它变成你交互的界面,我们这方面也开始做一些探索。」
在王小川眼中,搜索可以提供你要的答案:
「因为今天给你 10 条链接,它也不知道你干吗,反正你自己点就行了,但当它懂你以后,它就会给你答案,给你解决这个问题了。」
搜索就是一种「人工智能」
「做搜索引擎本质上就是做人工智能,搜索引擎就是知道你要什么,在众多的机会面前帮你做选择,并具有一定的智力去思考。搜狗在人工智能领域也已经做了非常多的事情,在包括语音识别、图像处理、网页排序和商业广告体系等领域中都开始大量使用深度学习的方法。」
王小川觉得,搜狗的人工智能基因存在于具体的产品模式中。
在语音识别方面,因为搜狗在做输入法,有上亿人次使用搜狗语音输入然后转化成文字;图像处理方面,拍摄照片,然后通过图片搜索找到类似产品,这样的功能也已经上线了。比如当用户开车时,是无法用手输入文字的。搜狗的语音助手不仅让用户可以用语音输入文字,还能用语音进行修改,比如说出「弓长张改成立早章」、「大钟寺改成牡丹园」,系统都会立即对文字进行相应的修正。
另一方面,机器输出的也不一定是文字,而是可以帮助你产生一些你想要表达的答案。比如聊天场景中,我们说下午两点还是三点见?用户就不用像做填空题一样输入两点还是三点,而是机器给你选择甚至直接给你答案。
而在导航方面, 传统意义上的导航仅仅解决了「如何从 a 地前往 b 地」的问题,但其实使用导航时,用户并不只是为了前往 B 地,他的真正的意图是「去 B 地做什么」。比如一个人要去机场,这个人是要去哪个航站楼?到底是去出发层还是到达层?航班的情况如何?什么时间到最合适?这些问题都是用户潜在需要考虑的。
所以对导航背后意图数据做足够的分析,可以把首都机场分为 T1、T2、T3 航站楼,导入所有的航班信息,当用户给出航班号便可以得知航班的情况,对应出发和到达,并给出出发时间建议,把这些和语义技术结合在一起做出更好的服务。
搜狗如何让机器变得更加聪明?
王小川认为,接下来搜狗要做的是让机器变得更加聪明,去真正理解人类的想法。
「我们也希望在人工智能里面走的更远,包括对于视觉图象的理解,计算语言的推理。使得我们的输入法,走向一个能够更多地理解人表达的一种输入,也使得我们搜索引擎变成一个懂人的,能回答并提供服务的智能机器人。」
在这样的一个背景下,搜狗也和清华大学合作联合成立了「清华大学天工智能计算研究院」,该研究院将致力于人工智能领域的前沿技术研究, 而研究成果也将应用于搜狗相关产品及服务中。
「一方面我们会去开放大量搜索引擎独有的数据,使中国科研界所拥有的数据能力超过全球其他科研界所拥有的数据能力;另一方面我们也会去开放更多的计算的能力和算法的能力,使得中国的科研界或者说企业界拥有一个更好的人工智能的起点。从而使得搜索引擎天生拥有大数据以及计算能力,在整个人工智能的元年能够更好地推动人工智能的发展。」
除此之外,王小川还对 AI 技术有哪些思考?我们又到底该用 AI 来创造什么?在7 月 15 日的「奇点·创新者峰会」上,王小川将在现场分享他对 AI 技术的思考以及我们可以看到的未来。