期待人工智能突破鲁棒性可解释性局限

数据观 • 7年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

近些年，人工智能受到了极大的关注，其主要还归功于深度学习的兴起，极大地推动了机器人控制、计算机视觉、语音识别、自然语言处理等领域的进展，使得很多传统的AI任务取得了一些突破性的进展。例如，在大规模图像数据分类上，1000个类别的分类任务等一些指定的任务，前五个结果的识别错误率深度学习的算法甚至低于人类的水平。当然，最具影响力人工智能系统还数DeepMind公司推出的Alpha Go围棋系统，数度打败了人类的九段棋手。另外，还有一些人工智能系统，在某些特定的任务上，如写诗、作画、音乐生成、写字上甚至通过了图灵测试(注：图灵测试中的测试用户组的专业水平会很大程度影响测试的最终结果和结论)。例如DeepMind的唇语识别系统，甚至也超过了人类唇语识别专家的水平。本文将对当前人工智能的现状做一些初步的思考和探讨。

期待人工智能突破鲁棒性可解释性局限

　　 强化学习带来AI新时代

关于Alpha GO的技术讨论和分析已经随处可见，深度强化学习的应用是其成功的关键，这里我们讨论的是其对人类智能的一些启发和思考。首先，这样的AI系统跟人类的学习机制是有很大不同的。Alpha GO可以利用计算机强大的计算能力和建模算法的学习能力，短时间内提升其对弈的水平，这在人类的学习过程中是不可能实现的。围棋本质是一个策略搜索问题，有明确的评价标准，利用大量的数据和先进的计算模型，AI系统比较容易学习到最佳的策略;而人类受限于记忆、计算能力，更多从样本学习、归纳、总结和延伸推理中进行练习和提高。虽然Alpha Go声称模拟了人类的学习机制，但实际上这两者在学习机制方面存在显著的差异。其次，人工智能系统有可能探索出人类智力水平尚没有探索到的空间。关于Alpha GO的棋艺讨论中，专业人士给出了各种分析，他们发现了一些很古怪的、人类从未尝试过的下法。这其实要归功于强化学习的探索机制。强化学习可以以一定概率去探索一些未知的空间，并计算这种探索对未来长期回报的可能收益，因此，它可能探索出人类未知的知识和技能。从这个意义上来说，人工智能系统与人类可以形成很好的互补：智能系统利用强大的计算和存储能力，可以探索未知的知识领域，延伸人类对事物的认知。

尽管Alpha GO展示了人工智能系统的强大威力，但这并不意味着普遍意义的人工智能已经达到或超过了人类的水平。在当前的技术水平下，人工智能适合处理特定的任务，如计算密集型、搜索类(围棋、国际象棋等)的任务就很适合智能系统处理。而对于需要各种知识、语义理解、归纳和推理的任务，智能系统相对于人则还有较为遥远的距离。以人机对话系统为例，现在微软小冰算是全世界做得最好的闲聊机器人之一了，但是用户很快就会发现，她距离通过图灵测试还非常远，还远远没有达到人的对话能力和水平。

　　 AI与各领域结合进展瞩目

人工智能与各行各业的结合，取得了令人瞩目的进展。这里仅以机器人、智能驾驶、信息处理领域的相关进展为例进行说明。

传统机械领域与人工智能的结合产生了机械智能。工业机器人在汽车制造、电子电气、橡胶及塑料、家用电器等行业发挥着突出作用，而且伴随人工智能技术的发展，应用领域更加广泛。除了工业机器人，还有各种仿生机器人，在这里就必须提到机器人技术世界领先的波士顿动力公司，其研发的产品如Atlas、SpotMini、WildCat、Spot、JumpingRobot等，以及早期的BigDog，涵盖了双足、四足、双轮足式机器人。这些机器人产品体现了各种人工智能技术的综合运用，具有超强的目标识别、环境感知与建模、任务规划、协调控制能力，充分体现了人工智能系统的综合特点。此外，服务器机器人也逐步进入家庭市场。其中，软银公司推出的Pepper情感机器人，具有一定的情绪感知和情感表达的能力，而MIT推出的Jibo、蓝蛙公司的Buddy，则定位在社交机器人属性，具有与家庭成员进行互动、完成任务、协助儿童学习等功能。还需指出，制约家庭机器人发展的不仅仅是人工智能关键技术，还有涉及很多其他领域，包括机械、动力甚至材料，例如，动力的噪声，传感器的性能与价格等等。人工智能的发展必须与众多领域同步，才能够达到理想状态。随着未来人工智能及相关技术的逐步完善和成熟，服务机器人必将走进千家万户，人与机器人和谐并存的社会虽然还需时日，但可以期待。

人工智能在汽车领域一个火热的应用就是无人驾驶，谷歌、特斯拉、百度等公司都在无人驾驶上进行了布局和投入。2017年年初，Drive.ai公布一段在Drive.ai山景城总部进行复杂路况、环境下的无人驾驶路测片段，视频显示该公司的无人驾驶技术能够轻松应对雨天夜间的极端复杂的现实路况。这也意味着具有现实普及意义的无人驾驶离我们又近了一步。特斯拉、沃尔沃等高端品牌甚至已经配置了无人驾驶的功能。无人驾驶是典型的人工智能技术的综合运用，需要处理复杂的目标识别、环境感知与建模、规划与控制、综合决策等问题，对于智能系统的鲁棒性、不确定性决策、安全性提出了更高的要求。

人工智能也极大地推动了信息处理领域的进展。IBM在2010推出的深度问答系统Watson，在知识问答类的节目中击败了人类冠军选手，后来相关技术又在医疗健康领域得到运用，在辅助诊断方面获得了应用。国内搜狗公司研发的问答机器人在“一站到底”的节目中参加比赛，也取得了不俗的战绩。在计算机视觉领域，人脸识别算法甚至能在性能要求苛刻的“刷脸”支付中应用。在大规模的图像分类数据集上，识别错误率甚至低于人类的错误水平。在语音识别上，深度学习算法将之前传统模型的性能进行了数量级的提升，使得连续语音识别的性能达到了可实用的标准(一定环境下)。在创作类的任务上，例如图像风格转换、写诗、音乐创作、写字、对对联等方面，人工智能也取得了显著的进展，在某些特定的任务上甚至声称通过了图灵测试。在人机对话方面，从任务助理类的虚拟机器人如苹果的Siri、微软Cortana、百度度秘、阿里小蜜，到闲聊情感陪护的微软小冰，已经逐步在改变人机交互的范式，促进从鼠标键盘、触控模式到语音交互模式的转换，也催生了互联网行业对入口类设备如智能音箱的激烈争夺。这些将会全面改变人与机器的交互方式以及信息管理方式。

　　 优秀AI须具备三特征

我们认为，一个优秀的人工智能系统之所以能号称“人工智能”，应该具有三个方面的特征：从数据或经验中学习的能力、运用知识的能力、处理不确定性的能力。

学习能力：系统需要具备从数据中或过去的经验中学习的能力，这通常需要运用机器学习算法。更进一步，如果系统具备从环境交互中学习，在与用户交互过程中动态学习，具备一个不断进化和进步的学习能力，那么就可能具备更高的智能水平。同时，学习过程应该能够融入尽可能多的知识类信息，方能够达到支持智能系统的要求。

知识运用能力：知识是智能体现的一个最重要的维度。听说看能力如果不考虑内容的深度，则仅仅是停留在感知智能的层面，只能与环境交互和获取环境的信息，其智能表现的空间非常有限。只有基于知识的智能系统才能够从根本上趋近人类的逻辑推理等深层次的智慧表现。知识可以归纳为关于客观事物的规律、经验、规则，或者各种常识的描述。一个智能系统应该能够很好的存储与表示、运用知识，并基于知识进行归纳推理。只有将知识与数据融合，逻辑与统计结合，才能够催生真正拥有认知智能能力的智能系统。

不确定性处理能力：在现实生活中任何事情，确定性是相对的，不确定性是绝对的。因此，一个优秀的智能系统还应该具有很强的不确定性处理的能力，应该能够很好地处理数据中不确定性(噪声、数据属性缺失等)，模型决策的不确定性(决策结果的置信度等)，甚至模型内部参数的不确定性。无人驾驶系统就需要处理各种各样的不确定性如环境的不确定性、决策的不确定性，Alpha Go系统采用强化学习，以概率方式探索不同的落子方法。

目前，绝大多数人工智能的系统，还都或多或少地缺少这些应有的特质。

　 鲁棒性可解释性仍是局限

鲁棒性：当前以深度学习为代表的人工智能技术普遍面临鲁棒性的问题。首先，这些技术往往依赖大量的高质量训练数据和计算资源来充分学习模型的参数。但是，在训练数据量有限的情况下，深度神经网络的性能往往存在很大局限，一些规模巨大的深度神经网络也容易出现过拟合，使得在新数据上的测试性能远低于之前测试数据上的性能。其次，在特定数据集上测试性能良好的深度神经网络，很容易被添加少量随机噪声的“对抗”样本欺骗，系统很容易出现高可信度的错误判断。从另一个方面，系统初始建模时，由于数据充分使用能够得到比较理想的效果，然而，在投入使用一段时期后，在线数据内容的更新，就会产生系统性能上的偏差，严重时直接导致系统下线。因此，可扩展性也是人工智能系统实际应用的关键问题之一。模型的可扩展性，以及增量学习问题是绝对不可小觑的。如何应对上述挑战，发展鲁棒性、可扩展性的智能学习系统必将成为下一代人工智能系统的重要研究课题。在方法论方面，需要系统全面借鉴鲁棒的人类认知机理，不仅仅是神经系统的特性，还有认知系统(包括知识表示、更新、推理等)，发展更加具有生物合理性的人工智能系统。

可解释性：当前基于深度学习的人工智能系统普遍存在可解释性不足的问题。绝大部分系统被当做一个“黑盒”(即输入-系统-输出，系统的处理过程对用户完全不可见)处理，中间的分析、决策过程对用户来说不可见，也缺乏可交互性和操作性。尤其大规模的深度学习系统，由于网络中存在大量的复杂非线性变换和大规模的神经元连接，少量的随机扰动就会导致最后结果的剧烈变化，其行为和表现难以理解和合理解释。因此，可解释性成为下一代人工智能系统的重要特性和研究课题。一方面，具有较强可解释性的模型可以让使用者能够更好地对机器决策的过程进行理解，以决定相应结果的置信度，增加人对系统的信任度;另一方面，具有可解释性的模型能够为用户提供一个可操作的交互方式，使人的经验介入到数据驱动的建模和决策中，做到决策的追溯、引导和纠正，从而提升系统的性能与表现。

　　 不断磨练迈向强AI时代

人工智能在新的数据资源、计算资源、计算模型等的推动下得到了蓬勃发展。在今天，我们拥有了更多的数据，更强大的计算资源，理论、算法和模型也得到了很大的推动和发展，因此我们处在一个人工智能发展的最好时机中。Alpha Go的成功让世人认识到人工智能成功的一面，开启了人工智能的新时代。然而，对于具有很强学习能力、知识运用能力、不确定性处理能力的人工智能系统的要求，还有一定的距离。当前人工智能技术的鲁棒性、可解释性和可交互性等问题，也在实际应用中渐渐被提到日程上来。

有问题不等于不能够用，在人工智能研究不断推进的同时，落地的实用产品也不断被推出，技术在实战中磨练、更新。新一代人工智能技术将不断在鲁棒性、可解释性、交互性等关键问题上实现更多突破。人类必将逐步走向理想的强人工智能时代。

(作者黄民烈系清华大学副教授，朱小燕系清华大学教授、智能技术与系统国家实验室主任)

责任编辑：陈近梅