陆永青:通过开放平台打造生态系统可以降低AI应用开发成本
9月17日亿欧华东现场消息,2018世界 人工智能 大会在上海开幕。大会上,英国帝国理工学院教授、英国皇家工程院院士、美国电子电气工程师协会(IEEE)会士、英国计算机学会(BCS)会士、中国人工智能 产业创新 联盟专业委员会主任委员及 鲲云科技 联合创始人、首席科学家 陆永青 发表主题演讲。陆永青的主要观点如下:
1、开发高质量的深度学习需要深度AI知识、复杂的工具、高性能的电脑、比较先进的软件和应用领域的专长知识,但是通过个性化和定制化的平台就可以将这个过程变得简化。
2、如何让AI技术更简单易用,需要做到三步:首先是要把人工智能的需求转化成个性化的架构;第二是把这些架构再转化成为可个性化、定制化的平台,使得可以自动生成类似的架构;第三是使用这些平台来支持一个生态系统,让不是AI专家、芯片技术专家、硬件专家的人,可以从硬件技术进步中获利。
3、深度学习只是AI技术的一个部分。
以下为演讲速记,经亿欧整理编辑,供行业人士参考。
陆永青:非常感谢给我这样的机会,我在过去二十五年一直在英国帝国理工学院工作,过去几年感觉非常激动,为什么这么说呢?像姚教授已经谈到的,我有很多非常优秀的学生,他们建立了一家公司,就在上海,我们也通过这家公司来做一些前沿的研究,将研究变为一些现实应用,希望可以跟大家分享一下我们所做的工作。
在这里的图片给大家看到的是我们一直在使用深度学习的技术,希望能够检测到有没有非法倒垃圾的行为,主要是监测特殊类型的卡车,这些卡车可以将垃圾和其他不想看到的物体,静悄悄地倒在某个地方。不过一旦在摄像头里面装上AI芯片,让它更加聪敏和智能之后,这些摄像头就可以找到这种类型的卡车,这样也可以提示警察,卡车在不应该的时间出现在了不应该的地点,这在浦东的城市管理当中已经用到了。
在最左边的一张图片中,大家看到的是C919大飞机,这个项目也是在上海做的,我们和商飞进行合作,在C919飞机进行试航时,看飞机是不是有不稳定和不正常的情况出现。当中这张图片主要是分析卫星的图像,希望能够在卫星上进行分析。这样就可以通过找到一些模式,大大减少需要的电力,或者努力把数据进行压缩之后传送到地球进行分析。 这些都是非常有趣的应用,也都用到了深度学习的技术。
但是我们要开发高质量的深度学习需要深度AI知识、复杂的工具、高性能的电脑、比较先进的软件以及应用领域的专长知识,这样才能够找到应用的要求和需求。但是其实完全有方法可以将这个过程变得更加简化,更加简单。我们现在所使用的方法,是所谓个性化和定制化,那么如何做定制化的硬件和软件,满足AI应用需求,并且尽可能自动化呢?
稍微讲一下定制化的问题,传统的计算机和电脑,从一个程序开始,就是将程序放到一个固定的处理器当中,从左边到右边,使用的是传统的软件工具。但是现在,处理器有可能已经不再是固定的了,所以如果处理器的技术也可以个性化、定制化,就可以把这个过程逆向倒过来,有一个定制化、个性化的处理器,它可以为专门的领域应用。通过结合软件和硬件的工具,把整个处理器进行微调,来满足应用的需求。在很多情况下做一些专门领域的项目,可以定制化一些数据的表示方法、储存的方式等等,这取决于应用场景。
我们也可以定制化硬件,这个过程也是基于FPGA的技术,这个不会给大家讲的太具体,FPGA也就是现场可编程门阵列,有很多要素和元素,可以进行个性化定制,无论是在静止的时候还是在运行的时候,实施一些算法或者说是运算单位之间的连接,做到定制化和个性化。
前面讲了我们所做的工作,可以变成三个很简单的步骤。 首先是要把人工智能的需求转化成个性化的架构,里面既有软件又有硬件,而且针对某个领域。第二是如何把这些架构再转化成为可个性化、定制化的平台,使得可以自动生成类似的架构。第三,一旦有了这些平台之后,我们是不是能够使用这些平台来支持一个生态系统,其目的是让其他人就算不是AI方面的专家、芯片技术方面的专家、硬件方面的专家,依然可以从硬件技术进步中获利。
下面我们看第一个步骤,可定制化的参数。什么东西可以定制化呢?有很多的参数,譬如说算法、数据的表示,也可能是应用程序、设备特定的参数。除此之外,也可以把计算分割成不同的分类,并且进行编译,根据不同的应用和不同设备技术进行分类。还有架构本身其实也可以定制化,无论是编译时间还是定制时间,这个取决于使用什么技术。我们想要做的就是找到一个平衡点,满足设计的需求,满足某一个特定的应用场景,这个需求可能是速度、资源、准确性、能源、电力,或者越来越多的现在也会考虑到的隐私问题、安全问题等等。当然,个性化和定制化也可以为某一个储存技术或者储存能量来做。
这里有一个很简单的例子, 个性化深度学习加速器 。就像前面所说,这当中可以用来控制并且个性化定型的层级很多,在计算层面也就是最小的层面,是可以进行定制化的,可以做不同的解释,也可以在全连接、就是FC这里显示的;或者也可以在最上面一层卷积层来做定制化。这些是不同的参数集,不过可以在这个架构当中列出一系列类似这样的参数。这些参数都是不一样的,我们可以找到一个最优化的数值,使得它能够成为适用于某个任务的最优化的参数。根据这个架构打造出一个模型,使得可以找到最优化的模型到底是什么,以及现在的系统和最优化系统之间有什么差距。
我们看到各种各样不同的架构,这些都是可个性化和定制化的。一边是一个二元化的深度学习神经网络,在不同的应用中,比如手写、书写的识别,大概速度提高了三百多倍,所需要的电力是所有核心CPU的三分之一;另外一边是一套深度学习的网络,它不仅仅可以识别图片,同时也可以识别一些行动,就像李飞飞教授前面谈到的,能够认出一些病人的行动、行为或者是其他的一些想要监测的模型和模式。
深度学习只是AI技术的一个部分 ,我们还可以看其他的AI架构,其中一个叫做支持矢量机器SVM,另一个叫增量的SVM,可以使用它们来做一些财务工作,比如说股票交易和金融的运用。此外,还有一种所谓的单种类SVM,把它用在网络安全的应用上,希望在整个网络当中可以找到一些不正常的行为。。再比如,好友有一些额外的AI架构,例如所谓的遗传算法;还有一些可以用来解决一些销售人员的复杂问题的架构。同时更有加强学习的加速器,能够优化和加快整个培训过程,适用于各种各样的机器人,把它们的培训加速。
第一个部分可定制化的架构已经完成,有了这些架构之后,我们需要考虑的是有没有办法提高生产能力,让它们越来越快,同时更优化? 我们提供的是一个多层级的优化技术,做成可定制化的处理器。当我们设计实际应用、进行开发的时候,有可能并不能满足时间或其他限制的需求,所以就需要提供各种各样的反馈,从编译的版本再回到高层级的描述,让设计者可以修饰设计,这样实施的结果就可以更快、更好、更安全、更具有韧性和保障。
深度学习的算法也需要调试培训,才能适用于各种各样不同的应用场景,我们一直在想办法来支持各种各样不同的深度学习的应用。比如说我们希望找到办法自动调试算法,抽取出一些网络参数,这来自于高层级的描述,同时也可以自动生成低层级的硬件模块,提供一些可以让设计者挑选的最好最优化的硬件设计。这是从应用层开始的,使用的是深度学习的描述。进入到算法层,这也符合生成一些相应的网络,同时不断升级,如果在高层的描述上有变化,就会自动进行升级。在这个例子中,就会得出一个可以编程的硬件。如果需要一个非常好的FPGA,也可以做到。
现在我们开发的硬件非常小、像信用卡那么大的,但是里面已经集合了整个摄影、摄像头和网络的界面,大概是二到五瓦功耗,我们希望进一步降低,可以做实时目标检测、实时目标分割以及手势的识别。 因此,一个非常重要的要素就是要对它进行编译,如果只是一个芯片的话,是没有办法设计和产生的,很多人就没有办法用。但是我们完全有办法定义好这个网络,比如说通过高层级的描述,通过算法、培训、验证之后,打造一个深度学习的网络,再把它进行。比如SBAS的网络,为了能够变小,需要增加网络内部的效率。我们也做了自动化硬件空间的探索,希望可以找到最好的网络或者最好的实用场景是什么。现在我们的实用就是里面能够含有FPGA,这就可以进行编程,而且在最细节的地方进行编程,使它的性能和其他的参数都能够达到最优。
像李飞飞教授所说的,我们也找到很多可能性,做迁移学习,通过迁移学习优化培训以及它的推理,我们设定了一些标准或者是基干,有些东西如果从零开始培训是比较困难的,而且结果不是最佳,也比较费时,所以我们尝试各种各样不同的方法,调试一个事先训练好的网络,它的速度就会更快,同时更准确性,能够用于各种各样不同的应用。我们可以调试和微调一些事先训练过的网络,把这个过程自动化,把它们结合在一起,共同得出所谓的硬件应用。
这是一个图,大家可以看到上面是领域的知识,我们可以对各个层级进行优化。在下面是我们的硬件模块,有硬件的产生和设计。除此之外学习的技巧也可以获益于一些新的硬件设计,我们有新的迁移学习,对于新的设计可以自动识别,通过从数据库当中找到现有的设计,哪一些结构跟它是最为接近、类似,就可以自动把之前的设计洞察用到新的设计上。比如说我们的影像,可以把效率提高四到五倍,但是设计时间却不需要那么长。
最后一步是打造平台,通过平台我们可以打造一个生态系统,不断加速,同时降低AI应用开发的成本。
前面已经讲过了,我们有这样定制化的平台,越来越多不断往上走,也就是在描述层。比如城市管理人员,他们可能对于深度学习是不知道的,对于硬件也是不了解的,但是他们依然能够使用我们的界面,定义一些案例,以满足他们在什么时候想要使用这个培训,使用怎样的培训。同时他们也可以使用培训的结果,想办法找到各种各样不同的模式或者规则,来判断某一些活动,即使这些活动和行为是他们不想看到的。我们现在端对端的部署和开发锻炼,可以让那些就算是非专业、非人工智能或者硬件设计的人,也可以从最新的AI进步当中获利。
这就是为什么在过去几年当中,我们感到非常鼓舞,看到各种各样不同的应用出现,无论是试航还是卫星图像的压缩,还是气候监测和数据中心加速,或者一些金融财务的模型。除此之外,我们也和其他大学进行合作,包括斯坦福大学,看了各种各样不同的应用,无论从我们的遗传学、量子化学、气候监测和环境变化,有了刚才提到的能力,可以打造平台,可以进一步创建一个生态系统,应用的打造者、芯片的开发者和算法的开发者、应用开发者,这就是一个生态系统。希望到了最后,这是一个融合的社区,我们希望这也是一个智能的社区,就像前面提到的整个社区可以变得更加智能,这就得益于前面描述的技术进步。
非常感谢大家的聆听。
近年来,粤港澳大湾区在打造创新驱动新引擎,科技创新带动资源集聚等方面着力颇多,创新机制、产业升级、人才引流、协同发展等带来了多方面的机遇。相应的,人工智能、人才赋能正深刻地影响着商业步伐。
2018年10月18-19日,亿欧将在深圳举办 “引擎·引领” 2018大湾区国际科创峰会(BATi) ,集合智能制造、智能产品、智慧城市、智慧安防、智慧交通等一众热点问题展开探讨,分析科技创新未来趋势,盘点技术革命下的发展契机。
报名链接:
https://www.iyiou.com/post/ad/id/664?herkunft=6648