开展AI智商测试第一步:建立统一的标准智能模型
编者按:本世纪以来,随着互联网大数据的兴起,信息爆炸式增长,深度学习等机器学习算法在互联网领域的广泛应用,人工智能再次进入快速发展时期。与此同时,不同领域的科学家,企业家如物理学家霍金,微软创始人比尔盖茨等人,纷纷对人工智能的未来表达了担心,提出人工智能的快速发展可能对人类本身产生威胁,人工智能威胁论因此得到广泛传播。人工智能威胁论不仅仅是一个引发巨大争议的社会热点问题,其背后更是一个人工智能系统能否定量评测的课题。
由网易科技与AIE实验室共同启动的Omega AI计划已经开启了第一个问题的研究,即“人工智能最终能否超越人类智慧?”。要想研究这个问题,Omega AI计划正筹备建立AI智商测试,而建立这个智商测试模型的第一步,就是要建立统一人和机器的标准智能模型。
从1950年图灵测试提出以来,科学家已经为人工智能发展的评价体系做了很多工作。2015年3月24日“Visual Turing test for computer vision systems”在美国科学院院刊(PNAS)发表,提出一种新的图灵测试方法“Visual Turing test”,这种测试方法用来对计算机的图像认知能力进行更为深入的评估。《ACM通讯》(Communications of ACM)杂志主编瓦迪(Moshe Vardi)提出计算机的智能特性不能用单一的测试来检验,而应该用一系列的测试来证明,其中每一个测试都是针对一个不同的智能特点。美国佐治亚技术学院的瑞德教授(Mark O. Riedl)认为,智能的本质在于创造力。他设计了一个叫做Lovelace 2.0 版本的测试。 Lovelace 2.0 的测试范围包括:创作有虚拟故事的小说、诗歌创作、油画和音乐等。
在解决人工智能定量测试的问题上,包括图灵测试在内的各种方案还存在两个问题:第一,这些测试方法还不能区分智能的多个分类。也就是说智能是由多个要素组成。这些要素发展速度本身就是差异。第二是这些测试方法无法定量分析人工智能,或者只定量分析智能的某个方面,但这个系统究竟达到人类智慧的百分之多少,发展速度与人类智慧发展速度比率如何,这些问题在上述研究中没有涉及。
1.建立标准智能模型的前人研究
人工智能定量评测目前面临两个重要挑战:第一是人工智能系统目前没有形成统一的模型,第二是人工智能系统与人类为代表的生命体之间目前没有形成统一的模型。
这两个挑战都指向了同一个问题,即对于所有的人工智能系统和所有生命体(特别是以人类为代表的生命体)需要有一个统一模型进行描述,只有这样才能在这个模型上建立智力测量方法并进行测试,从而形成统一的,可进行相互比较的智力发展水平评价结果。
对于这个问题,前人研究者已经从不同方向进行了深入研究,这些研究为我们建立智能系统的标准模型奠定了基础。
(1)图灵机,英国科学家艾伦•图灵1937年发表了《论数字计算在决断难题中的应用》,文中提出了一种抽象计算模型-图灵机(如图1.1所示),体现了用有逻辑的程序或机器对数学运算过程进行模拟,重点突出了智能系统在计算方面的能力,但对人工智能系统、生命系统在其他方面的特点体现不够。不足以成为标准智能系统的模型。
(2) 冯•诺伊曼结构,1945年6月30日约翰•冯•诺伊曼在报告《First Draft of a Report on the EDVAC 》中提出了冯•诺伊曼结构,冯•诺伊曼在报告中明确规定新机器有五个构成部分:①计算器:②逻辑控制装置;③存贮器;④输入;⑤输出,并描述了这五部分的职能和相互关系,如图1.2所示。
冯•诺伊曼结构是现代计算机的统一模型,但它还不能涵盖包括人类在内的所有智能系统。
(3)提出韦克斯勒量表的戴维.韦克斯勒把智力定义为“智力是个人行动有目的、思维合理、应付环境有效的一种聚集的或全面的才能。所以说全面,是因为人类行为是以整体为特征;所以说聚集,是因为是由诸要素或诸能力所构成。这些要素或能力虽非完全独立,但彼此之间有质的区别[8]”。戴维.韦克斯勒的这个定义也可以看做是其对具有智力能力的人类特征定义。
(4)哈蓝•克利夫兰1982年12月在《未来主义者》杂志中的发表文章“资讯有如资源”,第一次提出DIKW模型体系。DIKW体系就是关于数据(Data)、信息(Information)、知识(Knowledge)及智慧(Wisdom)的体系,如图1.3所示。
我们曾经在“数据,信息,知识,智慧的关系”一文中阐述了它们的定义和关系[9]:
数据 是使用约定俗成的关键字, 对客观事物的数量、属性、位置及其相互关系进行抽象表示, 以适合在这个领域中用人工或自然的方式进行保存、传递和处理。
信息 是具有时效性的,有一定含义的, 有逻辑的、经过加工处理的、对决策有价值的数据流。
知识 通过人们的参与,对信息进行归纳、 演绎、 比较等手段进行挖掘, 使其有价值的部分沉淀下来, 并于已存在的人类知识体系相结合, 这部分有价值的信息就转变成知识。
智慧 是人类基于已有的数据、信息、知识,针对物质世界运动过程中产生的问题,根据获得的数据、信息、知识尽行分析、对比、演绎找出解决方案的能力。这种能力运用的结果是对已有数据、信息和知识产生影响和变动,包括数据、信息和知识库的增加、减少、修改和相互转化。
DIKW模型是知识管理领域里一个重要的模型,这个模型展现了数据、信息、知识、智慧之间的关系,同时它也可以看做智能系统如何运用数据、信息、知识、智慧的特征进行运转的模型。
2. 基于前人工作提出标准智能模型:
应该说前人的研究工作为我们提出标准智能系统模型奠定了很好的基础:
冯•诺伊曼结构给予我们的启发是:标准智能系统模型应包含输入输出系统,能够从外界获取信息,能够将内部产生的结果反馈给外部世界,只有这样,标准智能系统才能成为“活”的系统。
戴维.韦克斯勒关于人类智能的定义给予我们最大的启示是:智力能力是由多个要素组成,而非图灵测试或视觉图灵测试那样只关注智力能力的一个方面。
DIKW模型体系给予我们的启发是:智慧是一种解决问题,积累知识的能力;知识是人类不断与外界交互后沉淀下来结构化的数据和信息,这提醒我们,一个智能系统不仅仅体现出知识的掌握,更重要的还有关于解决问题的创新能力。
这种关于知识的掌握能力,知识的创新能力与戴维.韦克斯勒理论、冯.诺依曼架构结合,就可以形成智能系统智力能力的多层次结构。综上所述, 我们得出智能系统的标准模型应该具备一下特点:
第一、具有输入输出的功能,即可以与外界通过数据、信息和知识进行交互的能力。
第二.具有存储数据、信息、知识的能力,即将外界数据、信息和知识化为自身资源的能力。
第三.具有生成新数据、信息和知识的能力,即基于自身拥有的知识,在新数据或信息的启发下,对数据、信息和知识进行创新从而产生新的数据、信息和知识的能力,如图1.4所示(为了简化,本图中数据、信息、知识统一用知识描述)。
图1.4 智能系统标准模型示意图
3.根据以上研究,我们可以提出如下标准智能系统定义。
定义一:
无论系统(包括人工智能系统,人类等生命系统等),如果符合如下特征,就可以认为这个系统属于标准智能系统(Standard Intelligent System):
特征1 能够通过声音、图像、文字等方式(包括但不仅限于这三种方式)从外界获取数据,信息和知识的能力。
特征 2 能够将从外界获取的数据、信息和知识转化为系统掌握知识的能力。
特征3 能够根据外界数据、信息和知识所产生的需求,通过运用所掌握的知识进行创新的能力,这些能力包括但不仅限于联想、创作、猜测、发现规律等,这种能力运用的结果可以形成自身掌握的新的知识。
特征 4 能够通过声音、图像、文字等方式(包括但不仅限于这三种方式)将系统产生数据,信息和知识反馈给外界或对外界进行改造。
4.标准智能系统如何与外部世界以及相互之间进行知识的交互,下面我们用图1.5进行阐述.
图1.5 标准智能系统交互示意图
5.从图1.5中我们可以有产生以下几点认识:
(1)标准智能系统的知识来源包括:从外部世界直接获取的知识;从其他标准智能系统获取的知识;标准智能系统在自身掌握知识的基础上,通过创新产生的新知识。
(2)标准智能系统可以把掌握和创新的知识分解为数据、信息和知识传递给外部世界,也可以传递给其他标准智能系统,从而实现数据,信息和知识的内容同步。
(3)每个标准智能系统在交互过程中的表现会有差异,差异主要有:知识的获取能力差异;掌握的知识库容量的差异;对知识进行创新的能力差异;将自身掌握的知识向外部世界或其他智能系统进行传递时的能力差异。了解这些差异有助于我们有目的的提升其中的不足。
(4)所有的标准智能系统的知识库会形成一个总的知识库,这个总知识库会伴随标准智能系统的输入输入,以及创新创造而动态变化。
结语:
建立标准智能模型只是开展人工智能智商测试的第一步,在后续的文章中,我们将对基于这个模型的数据模型建立,对冯诺依曼架构的扩展启发,对智能系统的分级进行描述,以及最终实现人工智能智商测试量表打下基础。 (本文作者:AIE实验室负责人 刘锋)
关于Omega AI计划
网易科技与AIE实验室联合科学院等相关机构,共同发起Omega AI 计划,利用大众和专家群体智慧共同解决人工智能,互联网,脑科学等领域的前沿交叉问题。
Omega AI 计划的主要工作包括:向大众,科技企业家,风险投资家和科学家征集人工智能等相关领域重要科学技术问题。通过互联网平台邀请专家,专业人士参与探讨,研究 和解决人工智能等相关领域重要科学技术问题。定期召开研讨会和头脑风暴沙龙,对Omega AI 计划重点人工智能前沿问题进行探讨。定期通过网易科技,人工智能学家等媒体对外公布最新研究成果。 ( 详细 )