AlphaGo是形象工程 谷歌翻译对人工智能贡献最大
2016 年8月10日,出门问问创始人&CEO 李志飞博士参加了搜狐科技主办的直播栏目《无穷》。节目中,李志飞博士为大家解读了人工智能如何从学术研究领域走进大众生活,并且指出谷歌翻译的诞生使得人工智能有了质的飞跃。以下是搜狐科技对嘉宾演讲的整理。
图 1 :直播实况
人工智能在过去接近七十年的时间里经历了三个阶段。第一个阶段,是一九四几年到2005年。然后第二阶段是2005年到今年。接下来从今年开始人工智能就进入了第三个阶段。
在第一个阶段,科学家建立了人工智能领域里的每一个学科,包括图像识别、自然语言处理、机器学习、神经网络等,为以后的发展打下了坚实基础。但是在第一阶段,人工智能更多的是学术研究,而没有太多的应用。研究出来的产品也多数是形象工程,比如说IBM的深蓝大型计算机打败了人类的象棋冠军。大众并没有机会接触四类产品。
谷歌翻译的诞生标志着人工智能迈入了第二个阶段,因为谷歌翻译是人类历史上第一个面向大众的人工智能产品。历史上从来没有这么大规模的人工智能的应用得到这么普及的使用。并且机器翻译是人工智能里面一个非常核心的问题之一,甚至有的人说,如果你能解决机器翻译的问题,你就可以解决所有的人工智能的问题。
谷歌能带来这个转折有两个原因。第一,由于谷歌是一个互联网公司,有海量的用户以及数据。第二,谷歌拥有强大的云计算能力,有能力处理海量数据。这也是因为搜索引擎技术的发展,为了存储海量的互联网的数据,必须放在几十、几千、几万台的机器上,算完之后用一些很聪明的算法串起来。
在未来的第三阶段,李志飞预测人工智能会更多地和硬件结合,拥有更多的应用场景。
视频回放
【嘉宾演讲实录】
李志飞博士从人工智能学者到企业家的个人经历
首先我介绍一下我自己,我叫李志飞,我是出门问问的CEO。我自己的背景,我以前首先在美国约翰霍普金斯大学读的博士,做的方向是自然语言处理机器识别相关的工作,毕业以后去了谷歌,在硅谷谷歌的总部谷歌研究院做科学家,我主要的工作是做谷歌翻译,就是研究各种各样的算法,能够自动的提升各种语言之间的自动的翻译的质量。后来在2012年的10月份回到中国,创立了这个公司,出门问问。出门问问是一个人工智能的科技公司,我们的产品希望能够把这种AI的技术,能够真正应用到实际的产品,然后普通老百姓得能够用得着的一些产品里面去。我们首先是做语音交互,所以有个应用叫做出门问问。后来我们发现语音交互在手机上比较难起来,所以我们开始做各种各样的应用场景的尝试。比如说首先我们把出门问问放到谷歌眼镜应用里面去,用户可以通过谷歌眼镜来使用这个语音交互。
后来我们做智能手表相关的产品,首先我们做了一个操作系统,后来把这个操作系统放到我们自己的硬件里面去,最近我们也在做别的一些AI能够应用的场景的产品,比如车载,比如说家里的一些产品。所以我个人的经历更多的是从,首先非常学术,写论文,然后做研究,做算法,然后再到这种比较偏工业界,比较偏产品,像谷歌这样的,我们当时主要是来做谷歌的翻译,然后再到现在创业,整个过程就是一个离大众非常遥远的非常偏学术偏理论的背景,然后再开始接触一些产品。到现在,自己真正创业,直接面对消费者。所以其实这是一个本身也是一个差不多十年的时间,我觉得是一个很有意思的经历,就是大家确实也看得到以前这些非常遥远的科技,以前真的全部都是数学公式那种科技,现在突然之间可以变换成一个大家在手腕上或者家里面或者车里或者在手机上直接就可以使用到的一些产品。所以我想,今天我主要是跟大家分享一下我在这十几年自己的一些观察,以及我对AI怎么往前发展,以及未来有可能有什么样的应用的一些自己的观察和想法。
图 2 : 出门问问产品 TIC Watch
大众,产品经理以及科学家对于人工智能的不同认识
人工智能现在是一个非常热的一个话题,如果说你真的去跟每个人聊的时候,每个人对人工智能的理解是不太一样的。因为人工智能是一个比较庞大的产业链或者是一个学科,其实最上面有很多 普通的老百姓 ,对他们来说人工智能更多的是应用,就是他们能够使用什么样的产品,里面有人工智能。比如说无人驾驶,比如说谷歌眼镜,比如说苹果上面的Siri,这可能就是大众能够感受到的人工智能的基本的概念,他觉得机器也能完成一些以前人类才能完成的工作。这是从大众层面,当大众去聊人工智能的时候更多是这些产品应用层面。
然后中间有一个层次就是稍微懂一点技术或者说对技术比较关注的 科技工作者 ,但是他们又不是专业的人工智能从业者,他们由于对科技对新的未来可能比较有兴趣,所以他们可能会关注,比如说Siri,比如说无人驾驶,比如说谷歌眼镜,这背后的人工智能技术有哪几类。比如说苹果的语音助手或者出门问问的语音助手,这时候他就会关注里面有很多人工智能的技术,比如说语音识别、自然语言识别、垂直搜索、个性化的推荐,这些其实是,有这些技术层面,这时候对这些人,可能关注的,比如说产品经理或者CEO或者科技从业者,他们比较关心的是这些技术到了什么样的阶段,就是这个技术成不成熟,什么情况下准确率比较好,到底能拿这些技术做什么样的应用。
最下面有一群人或者说最直接跟人工智能相关的,无论是工程师还是 科学家 ,他们可能关心的就是,如果说你要做一个Siri,要用到语音识别技术,但是这个语音识别技术具体怎么把它做出来,我怎么去提升,这是这些科学家或者说工程师,他们天天在琢磨的。他们就会想,到底我能够发明什么样的算法,能够把我这种湖南的普通话也识别出来,或者把车里环境比较嘈杂的情况下也能够识别出来。这是需要很多数学的背景,很多机器学习的背景、深度学习的背景,天天去琢磨,到底我们用什么样的程序什么样的算法才能把这些问题解决。所以他们其实每天做的工作可能就是读论文、写程序、调试程序、做实验。
这三个层次,其实每个层次的人都是在讲人工智能,最上面的应用,大众媒体、中间的产品经理或者科技爱好者,最下面的工程师、科学家,每个人都在讲人工智能,但是其实他们讲的那些术语他们关心的内容他们每天从事的工作,都很不一样。当我们讨论人工智能的时候,很重要的一点是区分这个事情。所以我们今天可能更多的是讲上面两个层次,我们很难讲到说下面特别偏算法、里面具体的模型是什么样。
图 3 : 人工智能权威学者Geoff Hinton, Yann Lecun, Yoshua Bengio and Andrew Ng
人工智能发展的三个阶段:AI1.0, AI2.0和AI3.0
刚才说到,我认为人工智能其实在过去接近七十年的时间,我认为经历了这么三个阶段,这三个阶段的划分更多是从应用层面去讲的,不是从科学也不是从学术的角度去划分,为了给大家理清一下人工智能在过去历史上有一些什么样的事情。
首先第一个阶段,我认为AI1.0,是一九四几年到2005年,之前的应用很少然后第二阶段是2005年到比如说今年或者去年,就是这两年。接下来从今年开始,可能会有一些新的更有意思的东西,从应用的角度来说。所以我认为是这么三的阶段。
AI1.0 就是刚才说的到2005年,这个时候这个产业,学术界、工业界和政府,学术界很重要的一点就是说,这几十年里面我们建立了AI里面的每一个学科,像我们刚才聊到的语音识别、自然语言处理、机器学习,包括我们现在讨论得比较热的,深度学习、神经网络,其实这些基础的学科都已经建立了,这个其实是蛮重要的一个阶段,任何一个科技的进步都是一个金字塔,下面要把最基本的东西打牢,这是它最主要的成就。刚才那是学术界。
从工业界的角度来说,AI1.0时期的产品更多是一个形象工程,比如说IBM的深蓝的大型计算机,当时可能也是在十年以前吧,把人类的象棋冠军打败了,就像今年AlphaGO把人类的围棋冠军打败。后来一个沃森,在抢答比赛中把人类打败了。这些东西,不管是深蓝计算机还是沃森的问答系统,其实在某种程度上,我们老百姓从来都没有自己体验过。你说你用过深蓝的那个计算机跟它下象棋吗?
图 4 : 深蓝计算机正在下国际象棋
所以我认为那更多的是一些工业界的形象工程,某种程度来说就是塑造媒体形象,但是它的意义还是很大的,因为深蓝、沃森的研发,让很多科学家很多工程师会花很多时间去想这个算法,去研究这个大型计算机怎么去协作。所以我觉得它很大的一个成就是说,使得我们可以花很多人很多精力去集中式的研发这种大型计算机、大型的算法。那些大型计算机可能没有用在下象棋,但是可能用在天气预报,用在股票分析和别的一些领域,这是它很大的进展。
另外一个在美国科技进展特别重要的一点就是美国军方,你看很多计算机或者网络,包括人工智能技术,其实都是美国军方支撑的一些项目。比如我自己在美国读博士的这个项目,就是美国军方支持的一个项目。我们当时的项目是干什么呢?就是自动听中央电视台的新闻联播,然后做语音识别,然后做机器翻译,就是先把新闻联播的声音变成文字,那是中文的,然后中文自动翻成英文,然后开始做所谓智能的分析,看哪些东西值得美国军方去关注。所有这些AI的早期的技术肯定都是从军方这个项目支撑。像我们做机器翻译或者语音识别,可能很多很多博士生,PhD的项目都是军方的项目。
图 5 : 军方人工智能应用
这个是我认为第一个阶段的很大的成就是建立了学科,然后有一些形象工程,但是促进了计算机技术的发展。然后同时培养了一批人才。培养了一批专业做人工智能的人才。你想现在这些人才都是那个阶段出来的。这是第一阶段。但是从应用角度来说确实没有什么大规模的应用。
后来我认为在2005年有一个转折点,人工智能到达了 2.0阶段 ,我真的认为这是一个特别重要的转折点,就是谷歌翻译。为什么这么说?就是说谷歌翻译在2005、2006年的时候,把谷歌翻译这个产品推到网上,放到互联网上,这是人类历史上第一次有一个面对大众的人工智能产品,而且这个产品是以人工智能为最核心技术的。
人工智能是里面80%的最核心的东西。别的产品可能也有人工智能,但是可能是边缘的技术。但是机器翻译是人工智能里面一个非常核心的问题之一,甚至有的人说,机器翻译的问题就是,如果你能解决机器翻译的问题,你就可以解决所有的人工智能的问题。也就是说这是一个非常核心的问题。但是谷歌翻译,由于谷歌是一个互联网公司,有海量的用户,最后导致谷歌翻译这个产品一天有一两亿人的使用,有十几亿的句子放到谷歌翻译这个页面去翻译。这确实在历史上从来没有这么大规模的人工智能的应用得到这么普及的使用。所以这就是为什么我认为,从应用的角度,它是特别大的一个成就。而且就是因为谷歌翻译这个产品的要求是非常高的,当你把一个句子或者一篇文章放进去,一秒或者两秒就要出答案。以前我们在学校里做翻译,一个句子放进去,一般是40个字,英文,超过40个字的内存就不够了,挂掉了,40个字出去,一分钟两分钟出一个结果,那是很好的一个东西了。但是这种toC的产品,要求就不太一样了,toB一分钟两分钟一个小时,出来结果就可以。但是toC的用户是没有耐心的,这样的要求对技术就是特别大的挑战,使得很多科学家很多工程师就会去琢磨,怎么样能够做出一个大规模的机器翻译系统,但是又能够快速准确的输出这个翻译的结果。而且谷歌翻译做的不是一个语言对一个语言,是一百个语言,全世界所有的语言之间互相的翻译。这其实是,对很多工程上、计算上特别大的挑战。而谷歌翻译是第一次,我们能够把它一个特别复杂的问题在工程上做成一个toC可用的产品。所以这其实对整个AI怎么去做实现,在工程上,比如从数据从存储结构从计算,三者怎么深度的结合,而且能够产生出特别快,同时质量还不错的一个结果。这是特别大的挑战。
图 6 : 谷歌翻译可以翻译两百多种语言
正是因为这样,有一帮科学家懂算法,同时又有一帮工程师对存储对计算特别了解,使得他们可以配合起来把这个非常复杂的系统做出来。大家可能不知道这个系统有多复杂,当你把这个句子输入谷歌翻译,看起来一秒两秒就出结果了,但是后台可能几千台计算机在跑,而且是在全球各个数据中心,因为有各种各样的模型,有的模型在这个数据中心,有的模型在那个数据中心,可能几千台机器在算这个东西或者存储这个模型,才能快速把这个结果算出来。这在以前在工业界在学术界是不太可能的事情。这无论在应用角度还是研究角度都是很大的进步。有了谷歌翻译的应用,有了toC的非常高的要求,使得我们开发了非常复杂的平台非常复杂的存储的结构,和AI算法结合起来。这样后来语音识别、图象识别、机器视觉都是在经历同样的事情。
早期,可能大家不太理解,翻译的事情能这么做,语音识别能这么做,图象识别能这么做,广告业可以用深度学习这样做,很多这些应用就可以做出来了。所以我觉得确实2005年到去年到今年,最大的一个进展就是从谷歌翻译开始toC,从以前toB到toC,从军方、学校到工业界,从固定的到移动的环境,这种巨大的进步使得AI的应用在过去十几年发展特别快。现在其实有蛮多的AI应用,无论是谷歌搜索还是翻译、语音搜索还是谷歌眼镜里面的这些东西,包括现在的VR、机器人、无人驾驶,很多都用到了这些东西。
所以这个是我认为在过去这么一段时间,特别大的一个就是AI的应用上面很大的一个转折。
那么为什么是谷歌这个特定公司在2005年这个特定时间实现了人工智能的巨大转折和跨越? 如果做机器翻译,我们就从机器翻译这个角度来讲,IBM或者微软,他们做了很久。但是确实很不一样的是说,因为谷歌是一个互联网公司,它的云计算能力特别强,但是像IBM或者说微软,因为它更多是PC时代的这些公司,他们没有那么强的分布式计算的能力,不论是分布式的存储还是分布式计算的能力。
以前要么是单独的巨型计算机,计算能力很强大,所有的都在这上面算。但是谷歌可能用的是成千上万台机器,每台机器都不是很强,但是它能够把这些机器串起来,做很好的分工。比如这台机器算这个另外一台机器算那个,最后又能够把它串起来,把这个结果。这就是谷歌的这种计算平台。这里面就涉及到你怎么管理这几千台几万台机器。因为它的搜索引擎就是这么一种结构。
我们以前的数据库是集中式的,一台非常复杂的机器,特别强大,所有的东西都在这台机器上。但是谷歌,由于搜索引擎的数据量太大了,没法在一台机器上存储所有的东西的。这也是因为搜索引擎技术的发展,为了存储海量的互联网的数据,必须放在几十、几千、几万台的机器上,算完之后用一些很聪明的算法串起来。所以你问我为什么是谷歌,或者说为什么在2005年,首先分布式的云计算的技术,使得我们以前在学校或者在工业界做翻译不太可能的事情都可能了。
举个例子,以前我们在学校里面做翻译,因为任何一个算法都需要训练数据的,比如中文、英文,就是你给我一个中文句子,同时给我一个英文句子,你给我一万个句子,我就可以学习出一个模型。
但是以前在学校里用的是一万个句子,用十万个句子就特别牛了,这是美国军方花人工去标的。但是谷歌用的是千万或者亿级的句子,因为它可以在互联网上找句子,比如说圣经,有英文版有中文版有法文版,另外有政府的记录,比如说加拿大,有英文也有法文,本身就是对照好的。以前这些数据给了学校也不行,因为没有这么强大的计算能力。而谷歌有很强大的计算能力,可以处理这么多的句子对。所以时间点第一个就是谷歌拥有海量的数据,同时拥有能够处理这些海量数据的计算的结构。光有这个数据没有能力也不行,光有这个能力没有数据也不行,还要有海量的用户。这几点加起来使得它能够成功。IBM虽然有这些数据有这些能力,但是不是互联网公司,没有办法快速得到用户的这样一些商业上的行为。这就是为什么2005年,时间到了,数据、计算能力,加上谷歌确实本身很有抱负,一般的搜索引擎公司不会想到要解决全球的语言问题,确实由于这个创始人比较理想主义,他做这样的事情,这肯定是不赚钱的事情。所以我觉得这个时间点是跟这个有很大的关系。
为什么接下来会是 3.0的阶段 ,在过去四五年,由于深度学习,由于移动计算的发展,很多的AI应用还是以软件的形式存在。就是你手机里app或者互联网上的一个网站。但确实这个也会导致很多缺陷。比如说手机上的语音搜索,坦白讲现在还不是很普及,因为用户已经习惯了在手机上用触摸屏,用键盘。所以这个时候,如果说是未来我们希望AI真正能够得到更多的普及的应用,你真的时时刻刻要去用它,而且是作为最主要的交互方式。这时候可能需要的是我们要在软件硬件上做一个深度的整合。这是很重要的一点。你想,无论是无人驾驶还是VR还是这种智能手表,还是我们的机器人,其实都是这种新的硬件的形态。这些硬件的形态,刚才我举的例子,新的硬件形态,跟PC跟移动手机很不一样的地方就是说,它的输入输出的场景很不容易了,比如开车的时候,放在手腕上,这个屏幕很小,或者无人驾驶,还有VR,其实以前这种靠键盘靠触摸的交互方式就不一定最有效了。这时候像语音交互或者手势或者是计算机视觉的交互方式更合适。也就是说AI是一个逻辑上的东西,比如我认为这个设备是一个载体,或者说AI必须附体,必须附在一个载体上才能真正得到很深入的很高频的应用。
第一它作为一个媒介就很容易访问它,而且AI很重要。第二,戴在手上一款设备,它知道你的东西会很多,会做出很多智能化的东西。就是在未来,接下来可能会看到多,我叫做AI原生态的设备。比如第一点,AI就是很重要的,在家庭里在手腕上在头盔里,AI非常重要,它会成为一个最标准的交互方式或者背后的技术原理。所以我认为这是未来可能会有这样一些发展。
人工智能的近几年的发展趋势
其实AI从来都没有变过,从学术界的角度来说。而且做学术的也还是那些人,只不过在过去几年,可能很重要的一个突破就是深度学习,在语音识别在图象识别上的应用上的普及。
因为以前,和刚才说的还是一样的道理,计算能力和数据,以前由于计算能力不够,第二数据不够大,这时候深度学习没有什么可以发挥的地方。但是由于最近数据很多了,比如说语音、图像很多了是因为我们有手机,很容易收集这些数据。第二由于我们的计算能力非常强大了,刚才讲的分布式、大规模的计算系统,这时候深度学习一些算法,可能突然之间就可以用起来了。而且这首先就是在语音识别在图像领域有突破,一下子比以前提升了很多。这时候所有的科研人员就会开始关注这个问题,天天琢磨这个事情。
我觉得是大的数据、大的计算能力促使这些算法设计人员思考这些问题。以前,我们都很现实的,我们想了天花乱坠的算法有没有用,因为算不出来,或者没有数据支撑。不会朝这个方向去想。现在我们知道数据哪里有多少数据,然后计算能力有多强。这时候就有一批人专门琢磨发明新的算法,利用这个数据利用这个计算结构,使得我可以提升这个性能。这是相辅相成的。
人工智能是特别大的一个学科,它是一个综合体,比如语音识别、自然语言处理、图象识别、人脸识别、计算机视觉,还有个性化的推进,还有一些大数据的智能上的分析,都是人工智能技术。如果笼统的说,只要你用到了机器能够自动从数据里面挖掘出一些结构或者模式,最后能够帮助你做一些智能化的分析,这都是人工智能应用。如果这么展开的话,其实,比如说语音识别那是肯定的,比如智能手表里面用了很多人工智能技术,比如说语音交互,比如对着它说一句话,我们最近做了一个东西,比如说,你好问问,中国队得了几块金牌。你看,我很快就可以告诉你,总共在今年得了几块金牌,比如说是8块,到目前为止。这种就是应用到了语言识别等等这样的技术。
人脸识别,以及人脸跟踪,其实以前图像这一块的话,用的很多的,不一定是toC,就是在医院里面,你拍了一个照片,它自动给你做分析,就是拍了一个器官的什么照片,是不是这个器官有不正常或者怎么样。这个是医学图象处理,其实这是很大的应用,像西门子给有很多人在做。
包括你可以跟历史上的一些,比如说一些数据,比如说照片长成这样就可能会是有哪些病,有这些训练数据的话,也可以定义出一些新的病。
我们再继续,你刚刚提到很有趣的事,医学方面的应用。那除了像我们平时熟悉的Siri这样的生活中的应用,有哪些领域离我们比较远,可是我们怀有好奇心,可能想要了解的领域?
我觉得基本上就跟手机或者互联网,把所有的行业都做了重新的改造一样,我觉得人工智能的算法也会在一定程度上对未来这样的产业有很大的重塑。
其实已经在发生,比如说金融,预测股票价格。但是现在不一定做得特别好,但是这是能做好的。其实如果你能够,比如说你在过去历史上,你知道这个股票在升还是在降,然后同时你也知道跟这个股票的相关的有哪些事件,有哪些新闻,有哪些财报的数据,然后包括一些舆情上的变化,甚至一些大的环境,政治上的变化,这些你都可以认为是一些信号,来告诉你说这个股票有可能跌还是有可能升。
其实一个股票分析员也是在做这么一个事情,一个股票分析员可能就是用比较人工或者是excel来看这些数据,根据自己的经验和大盘的形势,来看这个股票好还是不好。这些,其实坦白讲,只要是人能够非常清晰的说清楚他做这个事情大概是怎么做的,他用了什么样的信息,然后这个决策过程中用了什么样的一些规则或者一些思考方式,这时候我们就有可能用计算机的方式去做。
而且像美国华尔街有一个非常有名的基金,“文艺复兴”,这些人以前就是做语音识别的数学家,他们八十年代就开始做这个事情。文艺复兴是美国最好的量化基金,他们招了一批科学家、博士,都是机器学习的专家。
金融、医疗、房地产,还有送外卖。当然,外卖的应用可能没有这个点,但是背后一定是可以通过这些学习的算法可以改造的。比如说调度,怎么样能够快速的去把这些资源,比如说这个小区到底要多少外卖员,那边小区要多少。这些是可以通过数据动态来调的。比如说打折。就是什么样的人应该打折什么样的人不应该打折。比如我给你这样的人补贴,就是两个用户,一个用户我补贴了以后确实可以长期留在我这个平台,另外一个可能补贴了也会走。就是可以有一个选择。
所以我认为机器学习或者人工智能的算法或者技术,一定能够对各行各业都会有一个很大的改变。
Alphago 的意义何在?
你不能从实际意义去讲,谷歌有那么多人,总会有一些人,就是谷歌有一个721,70%的人,要做一年两年能带来什么的,20%是关注在未来五年,10%是关注到未来十年的,长期的,AlphaGO背后的这批人应该就是这10%。帮助应该非常大的,具体技术的话可能是把这种增强式学习,跟这种深度神经网络相结合,然后把它应用到一个下棋的,下围棋的这个问题里面去。这本身对我们对这个学科的理解是有一定的帮助的。下棋,你想教机器下棋有两种办法,粗略的说,一种办法是给它棋局,在这一刻机器应该怎么做,就是每个棋局,目前我方是这样对方是这样,这一点上应该怎么做,给了很多这样的例子。但是这个很麻烦,你要给很多很多数据。
另外一个就是说,我不告诉你这中间怎么回事,我只告诉你最终你赢了还是输了。我不告诉你中间怎么去赢,然后每一步到底该怎么做,我只告诉你说,最后这个棋局是谁在赢。这个就是不会直接给反馈,而是给最终的间接的反馈。很多时候机器学习是一步步的,而另外一种是告诉你结果,赢了给你奖励输了给你惩罚。
就像小狗一样,你把球扔到那里我给你奖励,扔到这里我给你惩罚,至于怎么扔到这里,你自己去想。所以像AlphaGO更多的是把深度神经网络的技术应用到这种学习里面去,这本身对学术界是很大的提升,而且围棋是特别复杂的问题,这对学术界有很大的帮助。未来这些技术是不是可以应用到医疗或者保险、金融甚至是我们的对话,其实对话系统也是一样的,如果你要造一个机器,和人的对话系统,告诉机器说这个对话结果是好还是不好,这个人有没有得到自己要的东西,通过这个对话,得到了给它奖励,没有得到给它惩罚,这个时候算法就可以自己学了。
很多这样的问题都是需要这样的间接的反馈,而不是一步一步的反馈。
这里面有很多细节,给它数据,机器自己跟自己下棋,然后告诉它结果是对还是错。这从学术角度来说很有用,从工业应用上,会有用,它把围棋的问题解决了,别的有一些问题可能没有相似性,但是我们可以建模成这样的模型。
海外众筹的经历以及从中看到的中外人工智能的不同
关于这款手表,我们在国内也做过很多次众筹,在海外也做了很多次众筹。确实这次众筹,我觉得这两边还是有蛮多不一样的地方。首先不太一样的就是说,国外的系统比较重数据,比如我们在众筹的这个平台后台里面可以看得很清楚,CNN的一篇报道到底给我们带来了多少的转化。其实这就是特别有意思的一件事情,因为在中国,确实我们做这个众筹的时候,你猜都猜不出来。因为这个其实是一个,就是技术上没那么难,但是涉及到一个产业链或者是全网的链接。我从CNN的新闻到众筹平台的后台,再到谷歌的分析工具,怎么样能够全网打通,最后非常精确的看到这个转化率。这为什么这么重要?其实对我们这样的公司特别重要,因为我们是特别偏技术的,我们特别希望很多东西是模型可以算出来的,比如说什么时候达到一百万,什么时候达到一百二十万,如果要达到一百五十万我应该在PR方面多做一点还是广告方面多做一点,还是站内导流多做一点,还是怎么引入老用户。这是指导我们整个众筹的过程。以前我在国内也想这么做,但是没法这么做,因为没有这个数据支撑你做这些事情。但是海外确实做这个事情特别有意思。我自己也觉得挺有意思的,比如说在Facebook上做一个AD,也可以看得很清楚,花一块钱可以带来几块钱的营收。目前中国还不存在这样的工具。
这从某种程度上说明中国跟国外还是有一些差距,怎么能够数据化,而且全网能够打通。目前中国在这一块,由于技术上的原因,由于生态上的原因,由于合作的原因,没打通,还是效率低,花了钱做了很多无用的事情,没有带来转化率。花最少的钱达到最主要的人群获得最高的转化。由于中国没有这样的数据驱动工具驱动的文化,这也反映了技术只要用得好,是能够提高整个社会的效率的。我刚才说了,facebook该投多少钱,我就非常清楚。
因为中国特别喜欢说,我们有多少用户,但是可能也没法判断。而且这是有时间限制的,把时间浪费在这里,就没有别的时间了。这也是,因为你问到中国和美国有什么区别,这也侧面反映出了一些。
如果只能在美国也是是非常热,但是人工智能在美国炒了很多次。比如像刚才说的象棋,IBM的深蓝打败了人类象棋冠军,美国也炒的一遍,人类要被机器灭了。沃森也是一样,当时讨论说问题回答都已经把人类打败了,接下来人类智商受到挑战。这种确实,在过去已经炒作了很多,所以相对而言,美国无论媒体还是大众还是这些工业界还是学术界,可能稍微会冷静一点理性一点,但是肯定不会完全理性的,相对稍微理性一点,因为教育程度各方面更好一点。比如说一些大的公司的高管,或者一些做深度学习做人工智能相关的,我觉得他们还是非常理性的,不会说因为我做这个东西,就天天吹这个东西有多牛多牛。
投资从来不是理性的行业。不过确实,最近无人驾驶特别热,某种程度来说,中国投资人工智能反而比较少。中国我认为,人工智能是PR热,但是投资是冷的。真正下单的没多少,因为看不懂。美国反而是说,PR没那么热,但是投资,就是相对而言会更多一点。因为确实美国很多这种投资者,本来就自己有理想主义的,自己赚了钱,还有一些本身是PhD,很多投资者是PhD,对技术有自己的判断。当你投资的时候,不懂技术,要么你会非常负面看这个东西,要么会特别正面看这个事情,无限臆想这个事情会怎么样。但是希望越大可能失望越大。而美国生态环境确实更好一点。
我觉得人工智能的这些技术,虽然今天中国已经很发达,而且中国跟美国的差距越来越小,这是一个大的趋势。但是我们如果说,人工智能最核心的算法去看,中国和美国还是有很大的差距。比如说,就举一个例子,我所熟悉的这种自然语言处理或者语音识别,像谷歌这样的公司可能有两百个像我这样的PhD在做自然语言处理,而且是全世界最最一流的PhD,而中国哪怕是BAT这样的公司,坦白讲可能有那么一两个、两三个,就达到这种水准的。
所以我们必须清晰的意识到这一点,不要天天说我们怎么怎么样,这是不现实的。确实,因为他们吸引的是全球的人才,而且很多很多华人,可能最一流的还是在美国。
但是我想说,整个人工智能最终能不能发展,能不能得到应用,中国由于我们资本很热,有钱,我们的应用市场很广,有人,有需求,这个时候中国我觉得中国公司能够在这种应用层面,怎么把人工智能技术应用到具体的问题里面去,和问题深度的结合,而且真正提升问题的效率,我觉得这个是中国跟美国不会有差距甚至中国会比美国做得更先进的。
我们没必要硬要说我算法特别牛技术也特别牛。没关系,到最终,就跟我们现在中国也有很多互联网公司,我觉得跟美国比也很强大。就是因为它的市场很大,当你变得很强大的时候,其实你可以把这两者之间的差距缩得越来越短。以前像我们这种在美国读过博士,工程师,可能很少回国创业。但是就是由于中国的发展,市场的需求。
所以这种差距是越来越缩小的,这就可以了。因为全球在某种阶段就是有一定的分工的,也许你可以想像,再过五年十年,可能全世界的PhD都会来中国工作也不一定。所以到那一天我们再去说,这种特别正面的,在算法层面的比拼反而可能是现实的。而今天可能还是有点不太现实,但是并不代表我们不可以在这方面投入,我们可以在应用问题上做得更深,把应用做起来,应用的商业模式起来了,其实很多时候人才就会慢慢的吸引过来。
电影中的人工智能猜想多数都不科学
接下来有一些比较有趣的问题,关于人工智能的一些天马行空的想法,一些可能性。像大家可能看过很多关于人工智能方面的电影,我们想聊一下关于这些电影里面的一些描述,是不是太过夸张或者是还是说,它的推理还是有逻辑在那里的,未来还是有实现可能性的。
关于人工智能的,其实刚才已经说了有几类人,另外一个划分是工程师、科学家,他们是一线写代码的,一类是未来学家,就是预测未来会怎么样。还有一类是科幻学家,科幻家,他们可能预测得更夸张,这是从现实到理想到超理想的这种状况。所以我觉得,今天讨论了很多,可能媒体、大众确实比较关心后面两者,而不会关注到底怎么做出来。
第一要有理解能力,第二而且讲那些东西确实比较枯燥无味,大众不愿意听。大众特别愿意听的就是说,明天机器要把人类给灭了,或者机器要犯罪了,机器要主动杀人了。
我当然不认可,其实任何一项科技肯定有正面负面,关键是你怎么利用它。而机器到今天,我觉得还是说,它能做的事情就是说,第一你得告诉它它的目标函数是什么,要非常清晰。比如说如果要杀本·拉登,它是可以杀人的,但是你就得告诉他本·拉登是谁,长什么样子,而且什么叫死亡。你要清晰的告诉他这就是你的目标,还有这当中,你不能伤害平民,不能投核炸弹,这是边界条件。就是所有的计算机问题都是说,你有一个目标函数,有很多特征定义,什么是达成目标什么是没有达成目标,达成目标用什么工具什么手段。这是计算机工作的一种模式,下棋也是一样。
所以你可以教它做坏事情,这是肯定的。但是所有的这些东西,确实就是说,都是我们人在给它设定这个目标,告诉它这个特征,有什么样的条件。
这种可能性我很难反驳说没有,我只能说我看不到一条路径怎么到达那里。我不能说它没有,因为确实是,有时候会有一些,我们就是看不到的一些东西。但是至少从现在已有的科技来看,我看不出一条路径怎么到达那里。
关于马斯克,比尔·盖茨等名人要公众警惕人工智能联名信有几个可能性,一个是他们疯了,一个是为了炒作。
如果这两种都不是,我更相信第三种,就是这种科技,我们第一天就应该想着怎么去规范它,刚才我们说了,科技越来越发达的时候,被反动或者恐怖分子利用的时候,肯定会有很大的风险。但是我们应该更多的相信,我想他们不是疯了,不是为了PR,而是希望大家第一天就开始关注,而不是到失控的那一天才来指责。
它可能是有可能性的,但是现阶段,我看不到今年我能做什么明年能做什么,十年以后我可能不太会想。因为我们是工程师。如果五年之内达成那里面的水平,我认为是非常难的,基本上是不可能。
人工智能科技是否会让一些人失业? 科技的进步肯定会使得一些低层次、重复性的劳动变得不需要人去做了,这是肯定的。所以肯定会有一些工种会需求越来越少,这是肯定。但是从人类的角度来说,那些工作人也不一定愿意做。这时候对大家作为人类来说,能够跟上科技的进步,学一些机器不一定能够代替的工作,我觉得这是一个,坦白讲从人类整个角度来说,也并不是所有人都需要工作的,如果有人不愿意工作不想工作,为什么一定要让他工作呢?如果科技能达到这样的目标,那也是很好的事情,可以使得很多人可以干自己想干的事情。