高文、赵沁平、俞大鹏、吴建平、桂卫华、廖湘科六位院士齐聚,共话人工智能开源开放平台的技术挑战
雷锋网 (公众号:雷锋网) AI 科技评论按:2018 年 12 月 17 日,由鹏城实验室、新一代人工智能产业技术创新战略联盟共同举办的「新一代人工智能院士高峰论坛」在深圳隆重开幕。本次论坛将持续两天,由 17 日的主论坛和 18 日的医疗专题论坛组成。论坛以「‘头雁’穿云,云脑启智」为主题,邀请了多位院士、国内顶级科技企业技术负责人参加论坛做报告,论坛的重头戏是院士 panel,多位院士将针对人工智能现状与发展的一些疑难问题展开讨论。此次论坛汇聚了国内人工智能领域顶尖专家,共同探讨行业变革与技术创新、探寻 AI 边界,是 2018 年人工智能领域最值得关注的盛会之一。
在 17 日上午主论坛的最后,迎来了主题为「人工智能开源开放平台的技术挑战」的院士论坛。参与院士论坛的院士都是鹏程实验室特邀嘉宾,他们是:中国工程院院士、北京大学教授、鹏城实验室主任、新一代人工智能产业技术创新战略联盟理事长高文,中国工程院院士、北京航空航天大学教授、教育部科技委主任赵沁平,中国科学院院士、鹏城实验室院士量子计算研究中心(筹)责任院士、南方科技大学物理系讲席教授俞大鹏,中国工程院院士、清华大学计算机科学与技术系主任吴建平,中国工程院院士、中南大学控制工程研究所所长桂卫华,中国工程院院士、国防科学技术大学计算机学院院长廖湘科。雷锋网 AI 科技评论为大家带来现场报道。
中国工程院院士、北京大学教授、鹏城实验室主任、新一代人工智能产业技术创新战略联盟理事长高文
作为本次论坛的主持人,高文院士一开始就指出了中国人工智能发展所存在的短板和劣势: 第一是我们的 基础研究和美国比起来相对薄弱 ; 第二是我们的 高端元器件,包括高端芯片、核心器件和高端传感器相对来讲比较缺乏 ; 第三是我们的 开源开放平台影响力不够 ; 第四个是 我们自己培养的人工智能领域的高端人才比较少 ,我们的高端人才只相当于美国的 20%,并且这 20% 当中还有一部分是从国外回来的。基于这些现状,本次院士论坛将围绕我们的开源开放平台这块短板进行探讨。
在高文院士的主持下,赵沁平院士、俞大鹏院士、吴建平院士、桂卫华院士、廖湘科院士分别针对人工智能技术开源开放平台这一论题表达了自己的观点和建议。
中国工程院院士、北京航空航天大学教授、教育部科技委主任赵沁平
赵沁平院士: 今天这个大会开得非常好,它的主题是开源开放平台,就像高院士讲的,这是我们的短板之一,但是只要从现在开始,我们坚持不懈地补齐这些短板,发挥我们的优势,我们一定能够成功。
中国人工智能发展了 60 多年,上一个发展高潮期是在 80 年代,特别是日本提出五代机计划以后,后来又进入一个低潮期(尤其是 90 年代),而现在又到达了一个高潮,因而 人工智能技术是呈螺旋式发展的 。上一个高潮期的热词包括知识处理、知识工程、专家系统、智能机,而现在这一轮高潮,主要是深度学习和迁移学习,实际上,前者就是分层的统计归纳,后者就是类比推理、类比学习,只不过技术不一样——现在的技术是大数据,其实现了几个进步:一个是高性能计算,高性能计算的发展为这一轮人工智能的高潮奠定了基础;另一个是互联网,它是本次高潮有别于上一次高潮的关键点。
虽然过去有一些东西是失败的,但是却是值得我们现在学习的,研究人员要学习、反思一下过去的东西,这会有助于我们的产业发展。 例如,上一轮高潮中失败的专家系统,当年的火热程度与现在的深度学习相当,然而现在却没有一个能用的,为什么?其失败的原因包括:第一个是常识的错误,第二个是时间和经验的知识的表达和处理错误,第三是这个专家系统是基于规则的,然而这种面向专家的知识构造的规则系统是非常脆弱的。 而现在同样火热的人工智能,包括深度学习实际上基本都是弱人工智能,因此现在的开源开放平台一定不仅仅是光考虑深度学习,也要尝试其他的方法。 当现在这些算法实现突破以后,也一定会面临此前那几个螺旋式上升阶段所面临的问题,我们要了解过去做过研究的那些方法并进行借鉴,敞开思维,在即将遇到的问题上,做出一些原创性的东西。
中国科学院院士、鹏城实验室院士量子计算研究中心(筹)责任院士、南方科技大学物理系讲席教授俞大鹏
俞大鹏院士: 今天开的是新一代人工智能的研讨会,大家也知道高文主任责令我在鹏城实验室开了一个量子计算研究中心,致力于布局未来的量子技术来助力人工智能技术的发展。我们现在为什么要关注量子?人工智能又为什么取得这么大的发展?其得益于三个关键的因素,第一是先进的算法,尤其是最近这几年,算法得到了长足的发展;第二是技术,现在的技术与 10 年前相比有了指数级的提高,这是人工智能能够影响到方方面面的重要因素;第三个是 海量的大数据每天都在发生指数级的增长,按照这个速度的话,将来这些大规模的无序的复杂的数据,需要一种新的智能手段来处理,而量子科技则可能是这种手段。
现在老牌帝国对量子非常重视,例如英国在 2014 年就提出量子发展蓝图,欧洲在 2016 年提出量子发展的计划,而美国也在今年提出了量子计算国家行动计划。不过现在我国也要在深圳进行量子布局,在今年 1 月份的时候,深圳市十大行动计划成立了深圳市量子科学与工程研究院,而上个月在高文主任的支持下,又成立了鹏城实验室量子计算中心,前者致力于量子材料和量子硬件方面的研究,后者则针对量子算法、量子软件云平台进行研究开发,其目标就是要在量子软件云平台的支持下,让全国人民能够用上专用量子计算机,让全国人民在开源的平台上学习量子软件、编程。
我国量子发展所面临的最大挑战便是被美国列为对手,最近的华为事件就是一个最典型的例子,不过这一天来得早了一点,如果再晚 10 年,我们会舒服一点。现在在国际上,量子信息领域已经是一个敏感领域,中国学生被禁止涉入这个领域了。最近从事量子研究的潘建伟等人要引进顶级的量子器件的核心技术,结果也被禁运了。然而这没什么可怕的, 越是在这样的形势下,我国的量子研究就越要在鹏城实验室这类研究机构的支持下,研发出美国有而我们没有的技术,冲破其对我们的阻碍。
中国工程院院士、清华大学计算机科学与技术系主任吴建平
吴建平院士: 很高兴参加人工智能峰会,因为我自己非人工智能专业出身,从事的是网络方面的研究,我谈一点外行话。我非常同意赵沁平院士刚才的一些说法,因为我们也是经历过 80 年代初期、中期那一轮人工智能高潮的,我是 70 年代末期读的研究生,记得非常清楚的是,我们班里 12 个人,差不多有一半的人在搞人工智能,不过搞的都是各种各样的专家系统,最后都不了了之了,因此前一批的发展确实能带给我们很多的思考。另外我同样也认为这一波人工智能热潮和信息技术这 30 年的发展有密切的关系,包括计算能力、软件技术以及互联网的快速发展。
在互联网的发展过程中,实际上对人工智能算法的应用是很多,像互联网最有名的路由算法,在 80 年代末期就已经基本稳定下来了,其中就大量采用了人工智能的知识。只不过人工智能现在被大规模应用于各行各业,所以才产生这么大的推动力和热度。现在国家发起人工智能的行动计划是非常正确的,和我国这些年发起的很多计划相比,都是战略性的、前瞻性的。
具体到人工智能这个话题里面探讨开源平台的问题,我觉得这是很值得总结的事情。在计算机的历史发展中,开源平台一直都是计算机文化很重要的组成部分,但是在历史上真正成功的开源平台也不是太多,比较成功的就数 Linux 开源社区。然而开源平台的发展走向也常发生一些问题,往往容易被一些大公司垄断,例如安卓系统,因此, 开源对于运作有较高的要求,否则就比较麻烦 。另外,他也指出我国发展开源平台主要面临几个方面的困难:一方面是我国的人工智能虽然火热,对美国的震慑力也挺大的,并且人工智能领域的论文发表也最多,但是 整个技术基础还是比较薄弱的 ;另一方面, 我国高端的人工智能处理的芯片也很少,合作平台也是一个大的短板 。
我觉得开源社区需要把握以下这几个方面:
第一, 整个开源平台应该有一个很好的顶层设计 ,例如互联网领域的协议基本上是一个有开源性质的协议,其所有的标准是开放的、没有专利的,因此把握开源这个事物的顶层设计非常重要,如果把握不好的话,就有可能走歪。
第二, 要把握好知识产权和开放使用之间的平衡 ,防止开发人员失去开源的热情。
第三, 开源社区要把握好跟厂商的关系 ,虽然目前大家看到是更加底层的技术,但是所有的这些技术无法把公共的底层技术抽出来,因此要明确开源社区与厂商合作的平台是开源平台还是创新平台。
中国工程院院士、中南大学控制工程研究所所长桂卫华
桂卫华院士: 很高兴参加这个论坛会,听了这个报告学到不少东西。下面我也从自身的自动化专业的角度,就人工智能谈谈我的看法。
我觉得人工智能目前有两个主要方向: 一个是从脑科学的角度,搞类脑、研究脑的结构,然后仿照脑的工作原理去做人工智能 ,虽然现在计算机的计算能力比人脑更快,但是人脑的推理和直觉方面的能力是目前计算机没有办法赶得上的,并且其跟医学等各个方面联系在一起,因此这个方向还有很长的路要走; 另一个方向就是在一些应用背景下来研究人工智能 。
今天探讨的是平台问题,我自己从事自动化领域而且是面向工业和应用的,跟习总书记一样认为人工智能要跟一、二、三产业融合,为国民经济发展添薪续力。在人工智能应用以及解决问题的过程中,就需要有平台,然而 目前我国工业应用的所有软件平台基本上都被国外统治,尽管多年来我也一直试图在我们这个行业里面做这样的平台,但是没有成功,而没有成功的重要原因便是学校里面的考核机制:做平台不好写文章 。今天我看到很多的公司以及高主任领导的鹏城实验室来做这个平台,我觉得非常好。
同时我是做工业的,了解原材料方面对于人工智能技术应用的需求,然而现在的人工智能平台主要集中在交通、医疗等领域,工业领域的人工智能平台尚处于一个空白状态。
另外对于国家在工业软件上的布局,我也有一些看法,我觉得这些布局都局限于设计软件和制造软件,而没有涉及到在线运行的平台软件,这将非常不利于这些平台将来跟人工智能发展的融合,因此打造我们国家自己的工业领域的人工智能平台软件,还有很长的路要走下去。
中国工程院院士、国防科学技术大学计算机学院院长廖湘科
廖湘科院士: 今天参加这个会,也是第一次比较系统地听了铁军来介绍启智这个平台,我之前一直知道启智这个平台在发展,但对具体的内涵没有了解,听了以后有两个特别大的感受:一个是比较振奋,另一个是替铁军感到担心。
一方面,在软件领域,尤其是基础软件领域,所有的共性技术创新都是以开源形式开发出来的;不过另一方面,正如铁军在演讲中提到的, 虽然 BAT 也做了很多的开源平台,但是在国际上都排不上名 ,这也说明了,我国在开源领域的影响力以及在基础软件领域的真实水平。正是因为如此,本次高老师牵头鹏城实验室,将人工智能开源作为一个重点的突破,对于我国软件未来的发展意义重大。
另一方面,我也确实有一些感到着急和担心的地方。一个开源开放平台必须有一个有核心竞争力的软件,而这个核心竞争力的软件做应该是不一样的,我所担心的是, 一些做开源平台的人会面临非常大的压力 。此外, 我国现在之所以还没有任何有影响力的开源平台,一是因为我国技术底子薄弱,二是因为我们不会运作这个开源社区, 因为现在开源社区已经是一个很大的生态链运行,我国在这方面与国外还存在较大的差距,因此加强国际合作是很有必要的。 技术的发展不能仅仅是要立志于做属于中国的技术,还得有国际视野。
高老师扛起这个旗,我很敬佩,但是要做好这个事情,我觉得难度是很高的,如果是我,我肯定不敢来干这个事。
现场嘉宾 Q&A(部分节选)
Q&A 1
参会嘉宾: 我有两个问题。第一个问题是,我觉得开源项目非常重要的一点就是,每个项目都需要找到一个愿意「奉献」的灵魂人物,我们的新一代人工智能开源开放平台 OpenI 应该采取怎样的方式来建立这样的一个体制呢?第二个问题是,高开源项目其实是需要强大的企业参与其中的,比如 Linux,虽然它的灵魂人物是它的创始人,但是很多企业和大学真正做了很多工作,其中最核心的就是英特尔,那我们应该怎样激励中国强大的企业真正并坚持为开源项目提供支持,从而推动开源的形成与发展呢?
高文院士: 我简单回答一下。第一,正如刚刚廖院士所建议的,开源联盟的机制很重要,但我们也不是封闭起来自己做一套机制,而是 会借鉴 Linux 开放运作模式,包括请国际上一些比较有经验的人参与运作,保证机制上的开放性 。当然之后企业也会在其中扮演非常重要的角色,但是前提是有一种有效体制机制来推动,并且这种管理模式和现在科技部已经布的几个开放平台都是融合的,并不是排斥的。
第二,一个开源项目如果想做好,其中分别会对企业、组织或者个人设置不同的激励,这也和第一个问题是相关联的。 企业可能并不需要什么资金上的回馈,那我们就用参与感或者帮助其进行企业宣传来激励它们,主要通过体制机制的设计让企业在里面扮演更重要的角色 ;另外对于个人,我们则会通过基金会给他们一些资金或名誉方面的激励。OpenI 是一个软件管理平台,接下来我们还会做一个深圳云脑的硬件平台,支持包括国内外的几乎所有开源项目,在起步初期,我们也希望国内其它做人工智能的企业也能在里面扮演很重要的角色,会积极调动企业的积极性。
Q&A 2
参会嘉宾: 我也有两个问题。第一个问题是,我现在在参与云计算与大数据开源项目过程中,深刻体会到我们中国传统文化中的开源基因比较少——大家愿意下载,却比较少人愿意上传,所以我想请教一下各位院士,要在中华传统文化增加开源的基因,在人才培养方面可以做什么?第二个问题是,国家定下 2030 年我们要达到世界领先水平这个目标,然而我们现在四个方面的短板显而易见,想请几位院士在这个论坛上实事求是地分析一下,要补齐这些短板,这条路到底有多难?
廖湘科院士: 我个人认为不能说中国文化缺乏开源基因,开源跟文化没关系,因为开源一个很大的驱动力是追求成就感,而中国人是非常追求成就感的。大家上传的比较少,我认为 第一点是因为目前很多人的开源水平不够,影响力小;第二点则是中国的指挥棒没有瞄准到这些方面 ,比如中国以前写英文论文,肯定不是说中国文化里面有写英文论文的文化,而是因为很多评估要求 SCI 论文,如果评估里面加入开源排名,那也会驱动大家去做这件事。因此我觉得 还是需要政府的指挥棒来发挥作用,例如我此前就在科技部提过建议,所有的软件项目不要以论文而是以代码开源来进行评判。
吴建平院士: 我感觉并不乐观。到今年,中国的计算机已发展了 60 年,很多高校也都在庆祝计算机系/专业成立 60 周年,然而这么多年下来,现在大家做得最火热的都在应用层,基础短板基本都不碰了,另外 CPU 现在也有人碰,但都是血泪史——今年的中兴事件以后,陈述血泪史的文章也很多;操作系统我们也做了很多,但到现在为止我们计算机用的操作系统还都是国外的。互联网更是如此,刚才提到互联网本来是一个开源文化, 我们的开源难做起来,实际上就是我们自己没有下功夫,不能一味简单地说这个东西是别人控制的 。虽然重视应用层确实可以很快推动国民经济的发展,让老百姓、社会发展分享它的红利,但是 对基础层的东西不够重视,就好像是将我们的大厦建在沙滩上,这座大厦崩塌的风险是非常大的,这是我最担心的事情。 雷锋网
。