阿里云闵万里:量子人工智能是AI发展趋势
蓝鲸TMT 刘敏娟
今日,在猎云网2017人工智能产业创新峰会上,阿里云人工智能科学家闵万里(山景)谈到了人工智能未来的趋势。他认为,“量子人工智能”将是人工智能的发展趋势,区别于深度神经网络等,阿里将更看重该方向。
据闵万里介绍,从上世纪70年代起,人们就开始解读人脑的认知过程。人类的脑神经网络其实非常复杂,换算成数据,每人每天要处理100PB的数据。
与此同时,人工智能的技术发展从动态信息流网络,到特征变量的大样本分布,再到最小充分子网-特征通路,本质核心就是信息通路。“在线”、“流动”、“关联”将会成为阿里人工智能发展的关键词,并且会协同利用阿里在大数据和云计算方面的能力。
闵万里表示,人工智能未来的趋势将是“量子人工智能”,这在美国已经有包括Google、IBM在内的很多企业正在研究,一些投资机构也在密切关注。
附闵万里演讲实录:
我的团队是阿里云的内部创业团队,2015年6月1号儿童节的时候我从电商部门调到阿里云部门,组建大数据对外创业团队,一个人开始。所以过去将近七百天,我走过你们所有经历过的历程,质疑、信任、逃避到最后变现时候的掌声。
所以今天我把我所经历的感受以及看到的未来的方向给大家做分享。我把题目改了,因为工业大脑主持人介绍的太聚焦,我想发散一下,就是人工智能的价值化道路。那么价值化道路应该怎么讲?
我们先看创业创新,什么叫新?什么叫业?把这个词解读好,其实我们就抓住了事情的本质。新有一种本质。大家听说过深度学习和卷积网络,我今天不会讲这个。现在有一个观点,好像一说人工智能就是深度学习?多少层?然后开源了什么?
当所有人谈那个东西的时候,你去跟踪你就不是创新。所以今天给大家讲的跟深度学习没有任何关系,我们所做的案例也不是在深度学习上。这是第一点,所以我们走自己独特的道路,技术创新,底层的理论创新,在基础领域。你掌握最核心的东西,你才有能力扭转整个业界的方向,定义未来的方向。
那么创业是什么?其实很简单,有做业余爱好,有做一些小的企业,还有做产业。主持人介绍的工业大脑和医疗大脑,其实改变产业的格局。从智能制造最核心的做出来,工业数据每秒每个T的数据你敢碰吗?如果不碰最有价值的东西找不到。所以我从两个方向说一下我在将近七百天做的创新创业。
图像、视频这些在任何峰会都可以看到,有卷积神经网络等等。我想我也不重复这个故事,这些我们都做过。在各种发布会上做实时的解析,在线视频的实时解析,还有做事件的标注,自动化的标注,比如扣篮成功。
再看一个一年前的事情,我们第一次向公众介绍我们人工智能的时候,我们选择这样一个场合,去年的4月8号(小Ai歌王预测),然后我们实时的计算,每一句唱词、吐字、灯光、特效,五秒钟更新一次,一直到最后的歌王是谁。
当时选择这个场景因为它与众不同,因为人类对艺术的鉴赏是主观性的行为。如何用算法把非理性的主观行为算出来,这是很有挑战的事情。不是看一个图片是猫还是老鼠,所以我们选择很难的课题挑战自己。当然结果大家也知道,大家说你们为什么没有顺着做下去?我们发现更大的领域远远比唱歌还重要。
我们先说创新,为什么我们可以做这些?我们回归事物的本质,我不用深度学习,我用什么?我们回归人的本身,看我们的大脑怎么构成?四年前奥巴马在白宫启动这样一个雄心勃勃的计划,做脑部的智能研究。
我们大脑有十的十次方的神经元,每个神经元处于半激活或者没有激活的状态,你可以想象十的十次方的节点,这个状态是非常大的体量。每天产生的量是多少?一百个PB,每天每个人一百个PB,所以量大到我们不敢想的程度。
所以大家彻底放弃了,这个事儿完全不可做,如何从脑部神经网络最本质的状态做?但是今天不一样,今天阿里云的计算能力,我相信其他友商的计算能力也差不多,对十的十此放不是一个很难的题目,所以我们从最本质的做起。
你在认知的上面知道哪几个神经元对事物做预测的时候,你就知道怎么改变它。这个回归左边这个图,大家看到那么多神经元,信号采集之后实时分析,这是我们做的人工智能。
好,怎么做?其实很简单,70年代的时候就有人已经在开始朝这个方向走,就是这样一个人大家看到戴着一个帽子,他测各个区域,脑电波。有了脑电波之后大家可以看到,这个上面有每个信号,实时信号,这些都是最原始的数据,一秒钟多少赫兹多少次,高频、多通路又有关联性。所以七八十年代的时候,分析的时候已经是非常难。
当然今天看起来不是很难的事情,大家想想如果有十的十次方怎么分析?需要用云计算和大数据。分析结果,这个例子是我早期发的论文做的,我们通过脑电波研究这个人真实的睡眠状态,有人有失眠症或者轻睡眠。你通过脑电波可以发现他的脑电波跳跃,跟别人不一样。
知道这个跳跃你可以在某个维度去刺激它,使得他能够睡下去。所以怎么在十的十次方中找到那个脑区去刺激它,这是人工智能研究的事情。这个本质是什么?其实就是网络信息流,点和点有通道有动态信息,有了动态信息后面怎么解析?
如果知道这个过程你就知道,我有十个不同的地方同时来了信号,这些信号又有关联,我怎么解析找到内在的关联强度?这个在五六十年代做传统的质量控制的时候,就有这种解读,但是今天不一样,因为数据量大,所以对它的复杂度提出了前所未有的要求。
如果我们从这样一个在线的网络流做实时解析,然后应用到我们的垂直领域场景化中,能够产生什么样的价值?哪些领域可用?这里有三个核心词,一个在线一个流动一个关联。在线不用讲,如果都是做离线计算很简单,我们慢慢做。但是更难我们做实时个性化推荐,就是一个在线行为。
流动的意思是什么?信息流从一个点传到另外一个信息流,如果我们把它的比喻一个路口到另外一个路口,也是流动。关联,一个地方堵塞就会蔓延上面波及到下面。所以这三点合一起提出非常难的问题,你的计算能力和算法能不能跟上?我们看有了云计算之后这些都不是问题。
我们来看一个工业大脑,这个事情可能跟我们普通人,包括我自己接触之前都是觉得很奇怪。工业生产领域,其实是那么复杂,流程一环扣一环,看起来跟大数据跟云计算、人工智能差别很大,那些工人没有人工智能的背景,但是恰恰这个场景下是有海量的数据,这是第一点。
每一个传感器一秒钟采一千次的数据,工厂不停的转,实时数据的差距,工业互联网的数据并不比移动互联网的数据,只是离老百姓远大家不关注。一环套一环,几十个流程,每个流程都有参数。这个场景就是典型的大数据的场景,人工智能的场景。
我们做了一个事情,两个月之前也有报道,1%的中国制造,怎么做的?大家看一下这个图中已经在讲一个事情,我们从右到左,老车间了解数据产生的机制,有了数据的机制,你才知道哪些是我最需要关注的过程和数据变量?也就是人的脑部神经,十的十次方神经元中哪几个是我关注的?
最后我们做到什么?我们把这个过程做了抽象,放在实时监控有一整套的控制逻辑。一旦出现异常现象立刻到操作环节告诉那个人,你必须把参数调到多少?最后的效果就是第一阶段1%提升,对应的收益是多少?这家公司一年上亿,他是全球最大的光伏产业第一。
所以在资金密集型、数据密集型的企业,如果有人工智能的应用场景所产生的价值是无法计算的。这是工业大脑1%的威力,其实我们还做过一个,看起来完全不一样的行业。做橡胶,大家开车有轮胎,刚才那是光伏产业,这两个产业不一样一个化工一个新能源。
但是我们用一套东西复制,这里面三个星期就做完了,就是这个轮胎。得到的效果,3%到5%的提升,这里最好的故事就是在跨行业的两个领域中,把同一个东西用起来。原因还是回归到流程制造上,数据密集型可以描绘为一个简单的大脑,可能不是十的十次方,是十的五次方。
在这个上面做实时的解析、预测、控制、预警,同样一套东西用在两个不同的领域。当你抓住事物的本质,整个产业都对你打开了大脑,你在那个层次上做了别人做不了的东西,世界就是你的。
我们其做了一个,这是可以说工业制造最顶尖的地方。大家知道手机、芯片、半导体的流片,再加上镀膜,上万个参数更复杂,所以这个更有刺激性,这个是十的七次方到八次方,已经接近人脑。所以这么复杂的地方越能凸显我们的价值。
这是在工业大脑我们用在O2O中,吃饭跟人有关系,你吃饭是人送过来,这是一个三国的游戏。怎么讲?三类角色,餐馆,做餐的生产的,运输,还有一个需求方,就是我们自己点餐的。餐馆有厨师,原材料少没有,送餐的人,骑车的人是不是被赌上,下雨天怎样?结果今天有一个会推迟一天或者提前十一点,所有的不确定性都是在这儿,整个过程又可以抽象一个内脑的神经网络。所以这样一抽象大家理解了,它看上去跟人没关系,实际上还是一个固定的网络,结构上的动态点。那么我们可以用实时的算法,实时的反推告诉那些骑车的人怎么跑,才能可能找到信息的最短通道,信息最短通道对应送餐的过程,那么我们做到了。
以往是人工调度,看地图。我们看地图已经眼花了,大家想象一下人工调度这个上面每个人都在动,跟打游戏一样,眼睛很快就花了,高峰期的时候一分钟处理几十个订单,我们看过那个调度,现在没有人调度了都是机器调度。
你们看到城市大脑就是这个问题,你开车的时候等红绿灯,你这个方向等红绿灯,这个场景我们都遇到过,这就是一个调节,就是把供需错位,那么我们怎么做?我们首先看你掌握的数据,你大脑接收的信息是否完整?传统的交警控制都是靠地面的传感器。
那么今天有一个地方是有所有的数据在那里,在天上。我们每个人用高德和百度,你在贡献数据。那么实际上我们有一个上帝的眼睛看你这个脑袋的网络,看网络此时此刻的信息流是怎样的?有什么滞后?
那么算法上去之后,我们在广州市去年8月份做的,这也有新闻报道,包括在都市报还有,那么今年我也看到了,很感谢一些友商,也有一些互联网公司提出互联网+信号灯的说法,那么说明我们开启了一个新的方向,在北方在你的后视镜的时候,这种感觉不一样,这就是真正的创业。
下面我讲未来的趋势。刚才讲了我们的人脑,十的十次方或者是深度神经网络这些东西,是现在已经发生的,正在发生或者将要发生的事情,值得我们业界的投资特别关注的就是量子智能。看看美国硅谷怎么做?美国航天局怎么做?它的威力怎么做?
大家可以看一些资料。传统的CPU是0或者1的状态,但是量子是0和1任何一个组,这非常了不起。可以用一个量子位表示上千个传统的二进制的信息量。如果这样一个结构出来之后,会带来革命性的变化,其实现在已经有了。我们看一下,如果在座有做机器学习的一定知道SAM,它的复杂度是N的三次方,如果我们用量子计算来做,从N的三次方到log的N,这是非常复杂的,但是这个事情已经有人证明了,去年4月份谷歌已经证明了这个事情。
这是特征脸,相当于大众脸,复杂度是多少?N的三次方,我们用量子我们做到什么,又是Log的N,这个就是量子计算的威力。我们再看这个表你就会发现,不得不赞叹我们就看现在人类,先不讲整个宇宙,宇宙太遥远。整个人类每年产生的信息量和量子比特描述这样一个行为,整个表大家可以看一下。
昨天有一个新闻,上个月有一个新闻IBM宣布他已经做成一个量子计算机,可以有好几个BT,在某些特定任务上能够达到几十个量子位的威力,所以这是未来的大势所趋。我们今天还沉浸在深度学习的时候,人家已经在量子了。
下面我总结一下。刚刚讲的那些价值化的道路,都是刚刚开始,还远远没有结束,作为我们团队或者作为阿里云,我们的使命是让更多的科技从业者降低这个技术门槛,能够在一个巨大的平台,把你想象的威力找到空间落实下来。
我们也有这样的机制,我们有天使有大数据计算,是全世界最大的,在上面有很多资源。我们的使命让更多的创业团队成功,包括我自己,因为我走过这个道路。如果在座有创业团队有想要创业的团队,有技术门槛的难题的时候,我们的大门是永远敞开的。
我们最后一次大赛的获胜者是友商腾讯,所以我们是开放的。人工智能的年代任何闭门造车、壁垒都是不成功的,开放包容的心态共同创新才能共赢。我们可以让创业者找到更好的投资对象,让创业者找到更好的平台加速你的成功,让我们一起价值化落地。