李德毅:知识工程是人工智能时代最有意义的课题之一
5月16日至17日,以“智能+时代,智胜未来”为主题的第四届 中国机器人峰会 暨智能经济人才峰会在宁波余姚举行,此次峰会主题涉及 人工智能 、 机器人 最新前沿技术、创新创业等多个当前被热议的话题。
在5月16日上午的主论坛中,中国人工智能学会理事长 李德毅 发表了“从 知识工程 到认知工程”的主题演讲,提出如今的人工智能的发展离不开 智能科学 和技术的研究,知识工程才是人工智能时代最有意义的课题之一。
智能科学的诞生方式
“智能科学与技术”是人类进入智能社会后,科学技术自身发展催生出来的一级学科,多学科交叉渗透和国家重大需求起了助催作用。
中国早就重视对智能和认知的培养,宋健主任是我们工程院的老院长,他在1993年就提出了“人智能则国智,科技强则国强”。
李岚清在1997年就提出了通过对脑科学的研究,若能提高人的学习认知效率,将是对人类一大贡献。
知识工程之父、1994年图灵奖获得者、美国工程院院士爱德华•费根鲍姆(Edward Albert Feigenbaum)对中国人的感觉,李克强授予他中国友谊奖的时候说了这样一句话,“中国有全球六分之一的人口,但是没有拥有全球六分之一的智能资源”。 当前,人的素质和智能产生的 大数据 正是训练机器人的素质和智能的前提条件。
理学里面的数学、物理学、生物学、心理学;工学里面的计算机科学与技术,文学的语言学,应用语言学造就了当今的智能科学和技术。
受脑认知启发的人工智能
脑科学,脑认知成为全球的关注点,对应过来的是人工智能。 受脑认知启发的人工智能,主要体现在脑认知和人体的动作,脑认知和语言,脑认知和视知觉,脑认知和学习。我周边的展览会都是讲的运动控制+智能。语言带来的智能的产业化给我们极大地惊喜,无论是听、说、读、写、问、译。尤是“问”,这么多年来搜索引擎就是在“问”,一开始我们进入关键词,现在直接用语言来问。科大讯飞语音产业在全世界占到了应有的地位。
这里面最难的一个是脑认知和情感,就是人的意识是哪里来的?我们有一句话叫“我思故我在”。我们要问人存在的意义是什么?只有有意识的人才能定义人生的意义,情感都是主观的命题。
因为中国人工智能学会和其他的20多个学会共同组成的论证组,得到了69个大学的一同的签约,一百名专家的签字,论证了这个报告。它们有五个方面,分别是脑认知、机器感知与模式识别、自然语言处理与理解、知识工程、机器人与智能系统。
我们学科的四门课都是人工智能的核心,受脑认知核心技能启发的核心。 这个核心里面脑认知是我们的基础,机器感知和模式识别是以视觉为主,自然语言处理和理解是以听觉为主,然后在这个上面积累出来是知识工程,加在一起就是受脑认知启发的人工智能。
知识工程研究的过程,我们可以看看历史,没有历史就没有未来。1994年美国工程院院士爱德华一开始说利用自动机对知识进行获取,不操作和利用的工程称之为知识工程。今天我们已经走过了40年,难道说知识工程还不够成熟吗?1999年爱德华在获得图灵奖上发表演讲,主题为《How the What become the How》,说明了什么问题?什么叫知识?知识就是力量吗?
劳伊雷迪跟他一起获得了图灵奖,还有西蒙也是来到中国很多次,不但拿到图灵奖,还拿到诺贝尔奖,还拿了美国心理学会的终生成就奖。我们的吴文俊做的几何定理机器的证明被全世界认知。这里还要提到一个重要人物,还有维基百科的创始人多纳尔•威尔士把知识给了全社会。
“知识工程”研究如何用机器代替人,实现知识的表示、获取、推理、决策,包括机器定理证明、专家系统、机器博弈、数据挖掘和知识发现、不确定性推理、领域知识库;还有数字图书馆、维基百科、知识图谱等大型知识工程。知识工程不仅仅是研究如何获取、表示、组织、存储知识,如何实现知识型工作(如教师)的自动化,还要研究如何运用知识,更要研究如何创造知识。所以在 几年前提出了知识工作的自动化,过了几年,大家发现这个定义已经不行了,自动化遇到了天花板,要靠人工智能来解决。
知识工程对教育的挑战
最明显的问题,那些白领包括教师在内,会不会被机器人替代?我们从小就被教育,知识就是力量,这个是培根讲的。费根鲍姆说这句话不太准确,他主张讲知识蕴含着力量。
什么叫认知? 我们看几个字,看中国机器人峰会,看到这个字你头脑里面是那一块发出反映,你想起一个字,听起一个字,说起一个字都不一样。这样的认知我们不该研究吗?这就是脑认知给我们的启发。我们的计算机做什么?只能存储,不能记忆。这么多年来我们一味的追求计算,计算的智能超过了单个的人或者说一群人,但是我们忽略了记忆。
记忆不是简单地存储,伴随有取舍,取舍地过程就是计算、简约或抽象,记忆和计算同时发生。通常,时间越长丢失信息越多。记忆常常有联想和搜索,联想和搜索也是计算。
无论是语言记忆还是图像记忆,本质上都是统计记忆,可以把语言记忆视为图像记忆地标注。 越是长期地、大量的、反复的,越难遗忘,也有一次性或者少量的难忘记忆,但不会很多。所以我们提出了一个很重要的观点,就是用数据的方法研究人的记忆和遗忘,这个图我以前写过人类的不确定的智能里面就提到了,什么叫识记、保存、再认与恢复。
我个人认为知识是遗忘和卷积,知识可以用数学的方式来表达,为什么卷积网络今天这么的时髦。用函数f(t)表示待认知的图像,用函数g(t)表示已经学习得的部分,那么尚待进一步认知的部分是:h(t)=f(t)×g(t)。
教育是知识工程的典型代表,如果说土木工程是修路铺桥,建筑工程是盖房盖楼,软件工程是在高效平台上生产新的软件,知识工程就是教书育人,学知识长本领。所以什么叫学习?学习到底跟智能是什么样的关系?学习是理解知识形成记忆的交互过程,记忆是学习的结果。知识工程应该研究学习和记忆。
当智能走进学校的时候,当知识工程走进学校的时候,传统的教育就要结束了。 知识不算是灌输,学知识也许和学外文、开车、游泳没有本质的区别,学习的动机比内容更重要,知识不应该是冷的,知识的运用比知识的容量更重要。 知识工作的自动化遇到了天花板,因此对教育来说,不仅仅是电子书包,更重要的是个性化的教学,将来大中小学很多的教师工作都会被机器人替代,我们要做的是教练个性化的教学,让智能进入课堂,让学生走向成功。
知识工程是一个认知的工程
如何听说、如何看,表现在大脑里面就是如何思维,因此我再一次强调研究脑认知应该研究记忆认知,技算认知和交互认知。人类对技术的贪得无厌的需求已经阻碍了我们的发展。为什么不能去研究记忆呢?我们用那么大的功率做一个阿尔法狗的程序,为什么不想想记忆可以加速它的功耗呢?我做的这个就是三个记忆区: 感觉记忆、工作记忆和长期记忆。
因此我们要学习记忆的形态或研发的过程,感知的理解和认知的理解是怎么样的关系。认知计算也许只有一种算法,相似的计算。确切的说,人的智能和高级的生物的智能在生物学上没有本质的差别,最本质的差别是人类创造了文字,于是可以把文明传承下来,其他动物创造文字的还没有。正因为有了文字,所以我们的意识和身体可以脱离开。
视觉认知是认知的主体,我做智能车,为什么这个车开出去走了一圈回来没有长知识。人不是这样的,当他一开始开车的时候到处都看,当他成为一个老的驾驶员的时候,他就不用看了。
因此,我们开始对冯•诺伊曼计算机说三道四了,我们认为脑认知的各个单元都要进行计算和交互,知识工程要防止被计算机误导,人们把计算机想象为电脑,很可惜它不是电脑,是一个计算的工具。
学习离不开交互,有指导的交互学习,无指导的学习。 就是我们现在做的卷积神经网络的分类和聚类。小孩子成功抓住一只高飞球,是长期结合实践的结果,并没有在大脑中建立形式化模型、建立三维空间求解复杂的运用学和动力学微分方程组,而是依靠小脑,从视野感知的运动时间和顺序转化为所需的肌肉运用的时间和顺序,包括感觉运动协调、平衡和控制等,并有能力预测行动的结果,久而久之,技能成为“新”的本能。
传统汽车仅仅是驾驶员手、脚或者说力量的延伸。如果说驾驶脑替代驾驶认知,并获得驾驶的指纹,每个人开车都不一样,有可能使得汽车成为驾驶员自己,或者说机器成为自己。这才是人工智能时代知识工程最有意义的课题之一,这就是我为什么乐此不疲的原因。
知识工程进入寻常百姓家
你们看机器人在和你聊天,它在和你听、说、读、写、问、译;机器人在给你开药方;机器人在为你的孩子做咨询,做心理咨询,做辅导。我现在和东南大学合作,让孩子们在手机上玩游戏我就可以预测他有没有自闭症或者说多动症,家里看到的电视里面的主持人可能是一个机器人,所以知识工程已经在我们的寻常百姓家里了。
如果人脑特定问题域的认知能力可以先局部地形式化,哪怕在微观上不具有组织结构的相似性,例如驾驶、写作、聊天等,当千千万万的特定问题域的认知能力工程化之后,用人工智能技术构建千千万万的特定机器人的认知脑,并通过移动互联网、 云计算 和大数据,是否可以倒逼并逼近一个人造生物脑呢?
可塑性是脑认知的基础,人的一生都在做不同程度的神经突触的修建,弥散在人脑神经网络环路中的记忆、计算和交互认知,是人的生命中通过大数据不断的学习、演变进而变成知识工具。