对话李国杰:突破麦肯锡和图灵的框框,人工智能要解决大问题丨GAIR 2021
编辑 | 岑峰、青暮
承载东莞突破固有发展路径而生的松山湖,是我国城市经济高质量转型的一个生动缩影。
在东莞启动的“科技东莞”计划中, 李国杰是最早参与合作的开拓者 。如果细数中国IT界的商业大咖,他的名字似乎鲜为人知。但你一定听闻过我国本土高技术品牌:“曙光”和“龙芯”。而李国杰正是它们背后的布局者和缔造人。鸿儒硕学的李国杰似乎与人们津津乐道的商业传奇形象大相径庭,他更像一位深耕学术的大先生,试图在科研、技术和产业之间,搭起一座融会贯通的桥梁。
目前,李国杰兼任中科院云计算中心的首席科学家,大部分时间住在东莞松山湖。
2021年,松山湖吹响了“改革、创新、再出发”的号角,而 “创新” 也恰恰是李国杰最看重的一点。
2021 GAIR大会现场
李国杰之前撰文道,
创新的关键不仅仅是建立世界一流大学,企业的眼界、实力和科技创新活力也很重要。
他也曾对国内AI研究的创新能力表示了担忧。“虽然国家高度重视人工智能技术发展,近年来我国学者也发表了大量的 AI 论文和专利等,在智慧城市建设、抗击新冠疫情、筹备北京冬奥会等应用中取得显著成效,出现了一些人工智能独角兽企业的AI落地成果。 但我们的研究多数是技术驱动、论文导向,目标导向和问题导向的研究较少。 ”
早在2006年,李国杰就在《中国科学院院刊》中指出:“尽管我国企业、大学、科研机构的创新能力都很弱,但我认为我国国家创新体系中最薄弱的环节是技术转移。”这也正是他自己做曙光计算机和龙芯CPU产业化的深刻体会,在担任中科院计算所所长期间,他也将 “技术转移” 作为提升科研机构创新能力的关键,并推动了计算所以 “创新跨越、持续发展” 为导向的科学院知识创新工程的实施。
2011年李国杰卸任中科院计算所所长后,位于改革开放前沿的中科院云计算中心(前身是广东电子工业研究院)则成为了他的另一个基地—— 2005年李国杰就在东莞松山湖创办广东电子工业研究院,这是东莞市首个与国家级科研机构合办的省级科研平台。
广东电子工业研究院
“建立广东电子工业研究院的目的有两个, 一是促进建立一批公共技术服务平台 ,对亟需转型的东莞加工制造业提供技术支持; 二是把该研究院打造为中国科学院技术转化的平台。 ”从李国杰谈及落地东莞发展的原因中不难看出,他正是将广东电子工业研究院作为承载自己创新与技术转移思考与解决方案的一块 “试验田 ”。
李国杰说的“一批”指的是,就在广东电子工业研究院落地东莞之后的第二年,“科技东莞”工程正式启动,东莞开启了联合高校院所、检测技术机构的合作共建之路。一大批公共科技创新平台相继落户东莞和松山湖,科技创新的资源加速集聚。
为褒奖李国杰多年来对东莞科技升级和创新的贡献,2021年,东莞市政府授予李国杰“荣誉市民”称号。
受疫情影响,去年李国杰在东莞居住的时间要更长,也使他得以静下心来,有更多时间去思考科学研究、创新和科技成果转化之间的关系。
而真正让李国杰上述想法“出圈”的,是2021年八月,一篇名为 《李国杰院士:国内AI研究顶不了天、落不了地,该想想了》 的文章。它如平地惊雷,引发激烈热议。也将一向低调的李国杰推向风口浪尖,批评声与支持声纷至沓来。
媒体和社交平台上关于 国内AI领域乃至整个学术界缺少原创性工作 的讨论,似乎从未停止过。究其原因,普遍认为是当下的学术评价体系不合理。
过分看重文章数目、IF、citation等表面化、指标化的东西,各大高校执行「僵化」标准评定人才。「论文导向」使得不少科研课题和研究内容来自“闭门造车”的愿望,脱离实际需求,不利于产生从0到1的创新工作,浪费了大量的资金投入。 「学术评价体系」 和 「学术潜规则」 的双重作用,或许正是造成李国杰文中所指出的AI研究“顶不了天、落不了地”的原因之一。
但也有人认为,李国杰这番说法“听君一席话,如听一席话”,正确但没有任何指导价值。还有人认为“这样的话我也会说”,在知乎关于该文讨论问题下有这样一条评论:“如果院士的水平,在2021年给出了顶不了天,立不了地的病情诊断;那么他应该立刻给出‘如何顶天,如何立地,为什么顶不了?为什么立不住?’的治疗方案。”
面对质疑,李国杰却保持了低调,仅在某微信公号上发表了一则简短的声明。在信息爆炸的时代,这条声明也如同投入湖中的石子,虽然激起了涟漪,湖水终究也会随着时间的推移而慢慢归于平静。
“我首先是觉得很欣慰, 因为年轻人愿意质疑、勇于质疑是好事 。”在2021年底召开的GAIR 2021 大会上,李国杰告诉雷峰网。
李国杰作为嘉宾参与了GAIR 2021“ 并行计算与系统结构40年 ”纪念圆桌的现场讨论。会后,李国杰与雷峰网进行了一次对话,评述了计算机科学和人工智能理论研究长期以来存在的“不以解决问题为导向”的倾向,对“顶不了天、落不了地”做了进一步解读: AI的“顶天”和“落地”指的是AI不仅要解决已有应用中的一些小问题,更要解决NP-hard级别的大问题,而我们目前在人工智能的研究方向规划上常见的问题是,要么不够“顶天”,要么难以“落地”。
这当中有历史的原因,也正是他希望提醒研究者们应该注意的地方。
以下为雷峰网整理的对话实录,雷峰网做了不改变原意的编辑:
雷峰网:我们先从您2021年8月的一篇“顶天立地”的文章说起。当时您的文章发表后引起了业内的广泛讨论。
李国杰:其实当时我已经发表了一个声明, 我并不是对中国AI研究现状做定论。 文章的原标题是《人工智能应用取得重大成果的启示》,主要是阐述AlphaFold在生物领域的突破性进展带给我们的启示,相关报社认为标题太平淡,未经沟通,便把题目改成《国内AI研究“顶不了天、落不了地”,该想想了》。
我在文章中提到的问题是指,目前国内许多大学和企业已经感受到“顶不了天又落不了地”的困扰。希望大家在选择AI研究方向上“多动脑筋”,AlphFold 2取得成功的主要原因是DeepMind团队目光敏锐地认定,用人工智能可以解决蛋白质结构预测问题。方向本身具有前瞻性、挑战性,而且解决后意义重大。我国启动的新一代人工智能重大科技项目,开展了数据智能、跨媒体感知、群体智能、类脑智能、量子智能计算等研究,已取得不少研究成果,但没有涵盖这种类型的研究。因此,我们该想想了。 这是提醒在选择人工智能做什么时候要多想想,不要“随大流”。
“顶天立地”的意思是: 在技术上要“顶天”,要敢于闯进“禁区”,做别人认为不可能成功的前瞻研究;;应用上要“立地”,要解决经济、国防建设中的大问题,也包括用人工智能技术解决基础研究中的挑战性问题。
雷峰网:对比国内人工智能的研究,我相信您的这些看法,也不是一朝一夕就形成的。请问是什么原因让您关注人工智能并产生这些想法呢?
李国杰:文章刊登后,做AI创业的年轻人不服气,我完全理解,毕竟在他们看来我只是一个搞高性能计算的‘老头’,有什么资格评价人工智能呢?我首先是觉得很欣慰,因为年轻人愿意质疑、勇于质疑是好事。
我在很多场合前说过, 我算是第二波人工智能的“弄潮儿”之一。
1981年中国科学院硕士毕业后,夏培肃先生推荐我到美国普渡大学攻读博士学位,研究与AI有关的组合搜索。当时国际AI学术圈中鲜有中国学者。1984年,我在AAAI大会上发表了论文,AAAI那时还是美国国内的人工智能协会(American Association for Artificial Intelligence,2007年AAAI改称为国际性的先进人工智能协会,Association for the Advance of Artificial Intelligence),名气不像现在这么大,在会上我没有遇到从国内到美国德克萨斯州奥斯丁来开会的学者。
1985年,同我的导师华云生教授,我们共同编著了一本自学参考书(Tutorial) 《Computer for Artificial Intelligence Applications》 ,连续三年成为IEEE最畅销出版物,当时新进入智能计算机领域的学者大多看过这本文集。在书中我没有使用 「智能计算机」 (intelligent computer)一词,而是采用 「适合人工智能应用的计算机」 ,当时很难做出真正意义上的「智能机」,只可以讲是将计算机应用于人工智能。1987年我回国工作,先后出任中科院计算所研究员和国家智能计算机研究开发中心主任,也将重心放在高性能计算研究上。 但我从未停止过对"人工智能"的关注。
李国杰与导师共同编写的书籍
雷峰网:可以说您见证了我国人工智能学科的成长和发展,最初人工智能在我们国家是什么样的情况?
李国杰:我国人工智能的发展是走过一段弯路的。 最早的人工智能学会不在中国科协体系里,而是在社会科学这个体系中, 挂靠在中国社会科学院下面。 (关于中国人工智能学会成立的早期故事,在即将出版的《中国人工智能简史(第一卷):致敬传奇》中有更详细描述)。
863计划初期,我曾是智能机专家组(306主题)的副组长。按照专家组的意见,戴汝为(中科院院士、著名控制论与人工智能专家)和我出面联络全国的人工智能学者,试图创立全国大联合的人工智能学会,跟全世界主流人工智能学会对标,归属到科协体系里,但此事没能做成。当时我们的人工智能研究与国际上主流的人工智能是不接轨的,同样是做人工智能,大家关注的东西有着不同的发力点。
雷峰网:您这篇文章里提到AlphaFold在生物领域做出了一些成就。您是如何想到用AlphaFold举例子的呢?
李国杰:我对生物领域的了解,是始于我的学生卜东波,他是这方面的专家。在AlphaFold 2问世以前,国内外有不少科学家在做用计算机预测蛋白质三维折叠结构的研究。卜东波团队2020年在Nature Communications期刊发表论文,在蛋白质结构预测方面做出了世界领先的成果。他做出来的几个代表性预测结果比AlphaFold要好,AlphaFold在CASP比赛中的GDT得分约为50多分,卜东波能做到70分。后来AlphaFold 2 做到90分就超过他了。
为什么以AlphaFold为例?这是基于我对人工智能的一个基本判断: 人工智能不仅要模仿人,更要解决大问题。 从计算机科学的角度来讲,人工智能应该关注 NP-hard级别 的难题。我们现有的人工智能研究,要么不够顶天,只能解决小问题,要么难以落地,难以在实际场景中得到应用。
雷峰网:您此前提到,学术界的人工智能研究过分局限于约翰·麦肯锡的定义,也就是人工智能的目标是“像人”,并指出我们应该突破对智能的狭义理解。这与AI要解决NP-hard级别难题有什么联系?
李国杰:“像人”的人工智能是一个已经被大家很重视的方向,但我认为人工智能的另一个发力点是 「解决大问题」 。 尤其是用机器学习的方法解决意义重大的科学难题,即在多项式时间内“有效解决”指数复杂性问题。
所谓指数复杂性是指求解一个问题所需的时间或空间(存储用量)随着问题规模增加而指数性地增加。这也就人们常说的 组合爆炸 。在计算复杂性理论中,将一大类目前还找不到 多项式级复杂性算法 的问题划归为NP-hard问题。如果一个问题能找到多项式级复杂性的算法,例如排序算法等,直接按确定的程序计算就能精确求解,人们一般不认为是人工智能应用。 人工智能要研究的问题几乎都是NP-hard问题,从其诞生开始就要对付组合爆炸。 从这种意义上讲,人工智能的“天”就是组合爆炸,所谓“顶天”就是找到巧妙的办法克服组合爆炸。
经过60多年的人工智能研究,对付计算机视觉、听觉、机器翻译等领域的组合爆炸已取得令人满意的进步, 但在基础研究和实际应用中还有大量的NP-hard问题等着我们去突破。 随着氨基酸单体的增加,蛋白质结构预测的计算复杂度呈指数级上升,如果用野蛮搜索,蛋白质结构预测的可能组合高达10的几百次方,这是典型的NP-hard问题。 如今的“卡脖子”的芯片设计问题也是NP-hard问题。 中国科学院计算所正在探索用“芯片学习”取代“芯片设计”,这可能是破解芯片设计人才缺口的出路。
这些才是真正的大问题,人工智能研究要顶天,就必须进入这些过去认为不可能的“禁区”。
难以落地是“不为也”,“非不能也”
雷峰网:上述您提到的两个例子,蛋白质结构预测和EDA都是应用价值很高的问题。您认为只要专注NP-hard级别的难题,就可以让人工智能研究既可顶天又能落地吗?
李国杰:还不够,这关系到计算机科学界的一个“传统”。有一本经典的关于NP问题的研究生教材 《Computers and Intractability: A Guide to the Theory of NP》 。书里第一页就是幅漫画,画中两个人在对话,一个人说:“我找不到有效的算法,但所有这些最优秀的人也找不到”(见下图)。这其实代表了计算机理论界对NP-hard问题的态度。
直到50年后的今天,这一“传统”仍在持续影响着一代又一代计算机科学领域的学者。 人们都在拼命证明 “这个问题是不是NP-hard” 。只要是NP-hard问题, 就没有‘我们’的责任了,而不再想有没有什么办法解决困难问题,这是很滑稽的局面。 其他学科都在努力解决各种难题,唯独计算机科学整天在 讨论什么问题解决不了。
只纠结于理论边界的证明,而不去想办法解决问题,这是我们无法让困难问题落地的根本原因。 几十年来,我们将NP-hard问题视作障碍,认为这是我们无法解决的问题。但是随着人工智能和计算机技术的进步,我们发现通过启发式搜索、知识工程和机器学习,加上充分大的算力,很多NP-hard问题可以得到满意的解。NP-hard意味着不可能的时代已经过去,NP-hard只是意味着可能没有始终有效和可扩展的算法而已,但许多NP-hard问题对于应用而言实际上有可以解决。人工智能学者的任务就是发掘出貌似不可能中的可行方案。
我这里讲的用人工智能解决NP-hard问题,不是指理论意义上的“解决”。
“P=NP”问题可能几十年内都解决不了,但人工智能学者可以在实践中不断逼近这个等式。 计算机科学界过去倾向于做理论上的完美证明,或许是后来人误解了图灵的意图 。 图灵定义了不可判定问题,例如停机问题,指出这一类问题永远不可能用图灵机解决,这就划定了图灵机的能力边界,反过来也就定义了什么是可计算问题。这个成果本身很伟大,但后来很多人却从错误的方向理解图灵机,他们执着于前者,热衷于探讨什么问题“理论上”不可计算或在可接受的时间空间内不可计算,而不是去积极探索如何“实际上”解决难解的问题。
这种认识上的误区来源于没有区分“问题”和“问题实例(Problem instance)”。 计算机科学中要求解的“问题”是指包含各种实例的一个问题类,而人工智能应用要解决的“问题”往往是具体的问题实例。实际上,一个指数复杂性问题(类)中最难解的通常只是其中很少的实例,其他的实例都是可以求解的。
机器学习的黄金时代
雷峰网:近几年深度学习很火,机器学习是不是解决NP-Hard问题的有效途径呢?
李国杰:计算过程中有复杂性就如同物理运动中有摩擦力一样,摩擦力不可能完全消除,复杂性也不可能完全消除。但摩擦力可以通过改变材料和运动方式减少,求解方法的实际复杂性也可以通过改变问题的描述方式或知识的表示方式而改变。 目前广泛流行的深度神经网络对一个问题的描述与过去的符号推理完全不同,深度神经网络通过机器学习获得的连接权重分布实际上是一种新的问题和知识表示方式,已经表现出前所未有的问题求解能力。
人工智能界流行一种说法:深度学习已经碰到天花板。但我认为深度学习还有发展空间,更广义的机器学习的巨大发展空间难以估量, 今后十年可能是机器学习的黄金时代。 机器学习特别是深度学习对于人类知识依赖性较低,可以应用到多种类型的NP-hard问题求解中。机器学习的可扩展性较强,通过规模化效应可能不断得到新的发现。人工智能是一门追求获得“令人惊讶”结果的学问,我相信未来十年会有许多“令人惊讶”的新成果不断冒出来。
人有“人智”,机有“机智”,知识的范围将扩大到“明知识”和“潜知识”以外的“暗知识”。机器学习、巨大算力与已有科学知识的结合,将推动科学研究走向基于人工智能技术的大平台模式, 科研的深度和效率将超过仅仅是数据驱动的“科研第四方式”。 现在已隐约看到新的“科研第五范式”的雏形。
人工智能离不开计算思维,但又不等同于计算思维。 图灵定义的计算(算法的执行)是输入到输出的函数映射,其结果一定是重复一致的,这种“计算思维”一定程度上限制了人工智能研究的创造性。“图灵机”不是指一台“机器”,而是指一台机器的一个特定的运行过程或使用方式,包括对初态和终态的划分。机器学习的输出属性往往要根据经历和处境而定,一个不断学习的系统是不重复先前的内部状态的。“计算”的概念不足以涵盖所有智能和认知过程。 简单地划分“易解”和“难解”问题的传统计算复杂性理论的框框也需要突破。
图灵机模型
雷峰网 (公众号:雷峰网) :您曾说国内学者与一流科学家水平还有较大距离,像AlphaFold2项目的成功,您认为是他们在选题时「目光敏锐」。但不是说随随便便就可以找到一个好科研课题,请问您觉得我国学者该如何培养科研中的「敏锐目光」?
李国杰:所谓“目光不够敏锐”,指的就是 布局的科研项目要么是增量式的技术改进,即顶不了天,要么是几十年都难以突破的理想型目标,即落不了地。 DeepMind学者利用AI预测蛋白质折叠结构,充分体现了超前的预见性,值得我们深思。
如何拥有「敏锐目光」是学术界的大难题,也是所谓「大师」和「二流学者」的区别。真理往往在少数人手里,真正能看准科研方向的科学家很少,而且科研中谁最先获得重大的新发现也有偶然性。但“随大流”是当前科研中比较普遍的现象,一般而言, 追热点,随大流做不出大成绩。
「敏锐目光」是一个人综合素质的体现,不仅是科学素养,还包括人文情操。 著名数学家丘成桐先生说过:“中国的理论科学家在原创性还是比不上世界最先进的水平,我想一个重要的原因是我们的科学家人文的修养还是不够,对自然界的真和美感情不够丰富。”
「敏锐目光」不是一个拒绝随波逐流的瞬间节点,而是纵向延伸的时间线, 节点前是对行业的深刻洞悉和见解,节点后是守得云开见月明的决心。 取得原创性的重大科研成果不仅需要 才学过人、敢为人先, 而且需要 “咬住不放”,持之以恒。
我们都知道图灵奖得主Geoffrey Hinton,他获得认可的背后是30年的默默坚持。当时美国主流学术界不看好深度学习,几经辗转,研究经费捉襟见肘的Hinton只能去加拿大。2006年Hinton终于一鸣惊人,在《科学》上发表文章。到2012年,Hinton与他的学生Alex Krizhevsky,夺得ImageNet大规模视觉识别挑战赛冠军,深度学习才得以被人注意,并从此大放异彩。
雷峰网:您曾表示,AlphaFold并没有提出新的科学原理,它更像一个集成工作。在文章中您也提出工程学技术不是工具,不仅仅是基础研究成果的应用,而是在基础研究中可以发挥巨大作用的重要组成部分,您是觉得我们现在对工程技术还不太够重视吗?
李国杰:不是。我们国家做工程的人不少, 但在用工程化办法解决基础科学问题方面,是有些脱节的。 我的意思是,组织数十人甚至数百人协同解决重大基础研究问题的能力有待提高, 在基础研究中要重视发挥工程技术的作用。 但在AI 浪潮之下,近来刷分刷榜的工程实现似乎看得太重了,而忽略了对规律本身的挖掘,这也是值得注意的。
AlphaFold团队是一个典型的跨学科合作团队,在《自然》发表此重大成果的论文作者有34位,其中19位并列第一作者,包括机器学习、语音和计算机视觉、自然语言处理、分子动力学、生命科学、高能物理、量子化学等领域的知名学者。蛋白质形成稳定折叠结构的原因是分子内部的势能会降到最低点,预测计算实际上是能量最小化的优化,这涉及许多领域的知识。
AlphaFold2并没有在蛋白质结构的构成机理上有新的发现,而是在工程上能够更快、足够准确地做出比别人好得多的预测,得到生物学界的认可,目前是最好的方案。
获得重大科研成果的方式跟过去不一样了,以前一个人冥思苦想就能做出成绩来,现在需要跨学科合作、强大的工程力支撑才能把事情做到,所以 工程技术现在是基础研究的一部分工作了。
雷峰网:如果让您用两个词语来形容自己,您会选择什么词呢?
李国杰 : “拼搏”和“宁静”吧 。无论是我个人成长经历,还是研制"曙光"和"龙芯"等项目,如果离开了"拼搏"精神,今天的种种成果都不复存在。但我当选院士以后,久别重逢的大学同学问我现在追求什么?我的回答是:“我在追求宁静”。“拼搏”和“宁静”看起来相互矛盾的两种境界在我心中是统一的。
从读高中开始,我的生活道路坎坷不平,对于升官发财、飞黄腾达从未有过奢望,只想在宁静的生活中追求洁身自好。林则徐的“壁立千仞,无欲则刚;海纳百川,有容乃大”,和诸葛亮的 “淡泊以明志,宁静而致远” ,这两对条幅一直是我的座佑铭。
实际上,我是一个很平凡的人。
我这一生并没有攀上科技高峰,做出惊人的科研成果。我很清楚自己不是一个特别聪明的人,能力也不是特别强。好在我经历得比较多,挫折比较多,所以不患得患失,认准目标就不会半途而废。看问题不太受小事情的干扰,内心有一股劲,就是要把事情做成,不达目标不甘心。
我说的“宁静”不是指如今年轻人常说的‘佛系’。现在网络中流行的‘佛系’是指一种 “无欲无求,对什么都不在乎”的态度。 我认为对好的事物还是要追求的,只是莫为争名夺利虚度了光阴。 不忘初心,不负使命,脚下的路就会越走越宽。
参考资料:
-
潇湘晨报《大国院士入莞十五载》
雷峰网原创文章,未经授权禁止转载。详情见。