微软创始人Paul Allen与人工智能:让机器人通过高中生物考试
微软联合创始人Paul Allen在他小时候就已经沉浸在人工智能的世界里了:在上世纪60年代晚期,到处可见神奇的智能计算机——嗯,是在虚拟的世界里。例如《2001太空漫游》里面的HAL,又例如《星际迷航》中进取号上无所不能的飞船电脑。Allen回忆到:“人们第一次看到机器能像人一样行动,这真是相当令人激动!这些机器人绝对是风靡一时。”因为父亲在图书馆工作的原因,他得以在那里搜寻到很多关于人工智能的信息,并且天天幻想着“宇宙里存在着某些即将灭绝的文明,通过领悟到了某种真理而拯救了自己。请试想,以下这样的情况如果真的出现了,会发生什么呢?——你能够收集到世界上所有的知识,然后把它们都存在一台智能电脑里,并且这台电脑还能够通过简单的自然语言和人类沟通。”
40年之后,对于已经是90亿美金身价的Allen来说,上述的东西可不仅仅只是奇思妙想了。今非昔比,很多当时电影中的技术已经变成了现实。每天我们都会通过语音向手机发出指令,然后收到它给予的反馈。搜索引擎通过对信息结构的语意理解,可以回答几乎所有问题。但是,这些工具实际上并不强大。Siri只能理解一小部分的问题,她不能进行任何方式的思考,比如推理。甚至是在Jeopardy! (美国著名益智节目长青树)中获得冠军的IBM的Watson,都只能处理一些语义清晰的简单问题。Google已经把《星际迷航》中的飞船电脑看做他们开发语音搜索的目标——但是依然长路漫漫。如果要将它变为现实,机器本身要更擅长沟通输出,并且——最重要的是,要具备思维能力。
让机器学课本
虽然听起来困难,Allen却正在致力于解决这个问题。在数年的思考之后,他投资成立了一家致力于完整解决人工智能问题的公司——Allen Institute for Artificial Intelligence, 简称AI2。像Allen早期在空间飞行和脑图方面的投资一样,这家公司野心勃勃,但是她的初始目标却很简单。在华盛顿大学教授Oren Etzioni的带领下,AI2想要制造出一台能够通过高中生物课程的电脑。团队给这台电脑输入教科书上的内容,之后对它进行考试。到目前为止,虽然这些测试都失败了,但是每次这台电脑都会比上次表现得更好一些。
在这个项目中,最关键的问题就是知识的呈现:怎样在教科书中呈现所有的知识,以让机器能够读取、理解并运用这些知识。通常,机器更擅长运行流程性质的程序(比如,把磅转换为千克),但即使当前他们开始知道什么时候该去运行对应的代码(例如,当你在搜索引擎中输入“32磅等于多少千克“,你会直接得到转换结果),他们也是在把所得信息僵硬的按照设计好的方式运行,而不是我们任何情况下使用的事实和原则。
AI2的这个项目可以为建立新一代的人工智能学习和思维方式打下基础。Etzioni提出:“为了让机器具有这两个能力,如何设计知识的呈现?如何通过越来越复杂的语言描述越来越复杂的事物?我们能把在学习生物上的经验运用到到化学、数学中吗?”
如何通过越来越复杂的语言描述越来越复杂的事物?
上述问题意味着科学家们要把握语言本身具有的复杂性。大多数语言本身并不提供那种计算机可以进行拼接的非连续性信息,自然语言的特点是模糊,并且逻辑复杂。Etzioni构想着在未来的世界,你可以这样问Siri:“我能把电视搬回家吗?还是是我需要叫辆出租车?”——要回答这个问题,除了需要计算电视的重量,还需要计算到家的距离,并且建立空间模拟出电视笨重的程度。Siri会主动搞清楚电视是否可以放进出租车的后备箱中。她会了解到你所说的“电视”仅仅是指你刚刚在网上看到的那台,把它“搬回家”的意思是说从附近的店里搬到你家。Siri会像正常人一样理解这个问题,搞清楚问题的重点,不会理解成我们是在问从商店到家这条路能不能走通。
如果能实现上述的设想,人工智能会对我们现有的世界造成巨大的影响。Etzioni说道:“我们认为语音交互是最自然的交互方式,我们需要做的只是建设足够的后端力量去驱动它。假如人们正在进入语音交互的世界,需要面对的则是语言处理和知识呈现这样棘手的问题。幸运的话,10年之内我们可以搞定它们。假如我们真的有所突破,这些技术会相当程度地驱动下一代的智能和去屏幕化的科技革新。”
超越图灵测试
如果我们解决了这些问题,他们的附带效应可能会非常有意思。语音沟通、推理和创造性思维之间共同的问题,在过去是计算机思维能力提升的瓶颈。Allen和Etzioni都是奇点论的怀疑者,但是他们都把AI2正在做的项目(让机器通过高中生物考试)看作是正在解决人工智能的根本问题。
AI2把他们的生物考试看作是AI2版本的图灵测试——图灵测试一直被认为是判断一台机器是否智能的黄金法则(可以点击这里尝试一下)。但是最近几年,它的地位已经被其他一些测试动摇了。在AI2的项目里,计算机所面临的测试和高中生面对的一样,假如他们的电脑可以通过高中生物考试的话,就会被认为是能够阅读教科书并且理解里面的知识——它“理解”了生物学,至少是以高中生的水平。
但是,Etzioni却提醒我:“如果你正在与研究人工智能的科学家交流,必须要谨慎使用“理解”这个词。专业角度来说,‘理解’这个词是指一个人内在的心理状态,对于其他人来说是不可能真正感知到的。所以图灵测试只是在判断外部的行为是否达到了某个特定的期望值。科学需要的是能够确定结果的测试,而不只是猜想,所以对我们来说,像图灵测试或生物考试这样的测试是最好的检验方法,虽然它们目前还不完美。不过如果一台电脑处理知识的能力和一个高中生相当的话,我们就能够确定它正在进行‘思考’,以及它的电路能够在一定程度上模拟人类大脑的运作。”
AI2设计的机器运作的方式和人类大脑不一样
我们不禁会想,如果这台计算机真的能通过考试,会代表他和人类一样也有了“感知”外界的能力了吗?对于Etzioni来说,这不是重点。他把人工智能的发展和航空器的发明做比较:“当他们在制作能飞起来的机器时,有些人会说‘我们得把这些东西做的像鸟,因为鸟就会飞’。另外一些人,比如怀特兄弟,认识到鸟类有着非常特殊的体重比例和身体结构,飞行器以当时的科技水平根本做不到这点,所以他们的机器会采用完全不同的设计——最终达到了相同的目标。”喷气式飞机无论从长相或者飞行的原理来看,都不像鸟类,但是如果你想坐着它来一个横渡大西洋的旅行,谁又会在乎它长的像不像鸟呢?
因此,AI2设计的机器运作的方式也同样和人类大脑不一样,但是他们都能做相同的事情——处理知识,进行推理,然后回答问题。这些机器“思考”的方式和以往所有的电脑都完全不同。只要计算机大脑的输入和输出和人类大脑是一样的,AI2才不会关心机箱里面是什么样子呢,这不是他们要考虑的事情。
“他智能吗?”
目前,Etzioni的电脑还在纠结于相当于四年级水平的生物知识,而且没法搞定那种答案没有固定形式的题目。理解图形尤其困难,需要代码很难塑造的空间想象与联想能力。他预计会花大概3到5年的时间去给这台机器构建一个能够通过测试的思维框架。在那之后,还需要很长时间才能完成框架的执行,并且开始把成果推广到实用领域。对于一家科技公司来言,这个过程过于长久——但是,对于一个研究者来说,只有这样才能站在尖端取得突破。
最后,Etzioni还补充道,当你真正开始投入到人工智能的研发工作中,就很难从外界甚至是上升到哲学的角度来审视它了。人工智能这种东西不太可能通过什么外部特征来分析它:“就像人类的大脑一样”他坏笑着说:“想象你双手捧着一堆黏糊糊的东西,你绝不会觉得这玩意能跟“智能”两个字沾上边……你只会觉得它是一碗不知道从哪搞来的恶心的浓汤。”
附:人工智能面临的挑战
因果关系,人类可以吸收新的信息来持续更新他们对于过去和现在的认识,这比Siri和Wolfram Alpha处理信息的方式要复杂得多,但是科学家们表示不久后将会实现这项技术。
知识的不确定性,布尔运算只能告诉我们“真”还是“假”,但是大部分人类的知识都并不精确,比如“较大汽车通常具有较高的每公里油耗”。未来的计算机将会能够处理不确定性。目前,IBM的Watson已经开始能够做一些简单地识别。
矛盾处理,从网上扒取信息意味着有可能会从不同的信息源接收到完全不同的内容。人们的大脑知道如何求同存异,基于更高的框架提取有用的信息,但目前机器还无法做到这点。
理解语义和隐性知识,例如,当我们听别人说到“能穿多少穿多少”,如果当时是夏天,我们会知道他的意思是尽量少穿。但别说机器人了,刚学习中文的外国朋友可能都分不清前后两个“多少”的意思。很难确定有效的规则,让计算机在不同情况下做出正确的判断。