英特尔中国研究院院长宋继强:融合 AI 与 SI 推进智能机器人产业
文/ 谷磊
今天,我们正在拥抱一个万物 智能 互联的新世界。越来越多的物和设备通过网络实现互联互通,让数据呈现爆发之势。数据洪流汹涌而至,数据正在成为技术领域最重要的驱动力。人工智能、自动驾驶、5G 和VR/MR 等一系列前瞻性技术的出现,令我们有机会充分释放这些数据的潜能,不断升级人类生活体验。
非常高兴从今天开始,我们在雷锋网(公众号:雷锋网)开设英特尔中国研究院专栏。借助这个平台,我们希望与大家分享并交流英特尔对于前瞻技术趋势的观察,探讨万物智能互联的当下与未来。作为专栏系列文章的开篇,让我们先从机器人、人工智能的视角切入,探究数据洪流时代的产业机遇。
融合 AI 与 SI 推进智能机器人产业
机器人作为人工智能最重要的应用领域,一直饱受关注。好莱坞大片中经常出现的智能机器人为大众设置了很高的预期,而现实的服务机器人的智能能力远未达标。伴随着近来深度学习催热的这一波人工智能大潮,智能机器人产业如何破局是一个很重要的问题。 我认为两个方面非常关键:一个是人工智能(AI: Artificial Intelligence)与智能交互(SI: Smart Interaction)深度融合;另一个是智能机器人的安全性。 关于安全性我们留到以后再谈,今天重点探讨AI与SI的融合。
AI 在学术界有一个比较常用的定义,就是要了解智能的实质,并且要能够生产出一种像人一样,以智慧的方式对外界输入作出反应的智能机器。这个学科的最终目的是让机器具有智能的反应能力,所以智能机器人可以看做是人工智能的终极目标。
了解智能的实质有两种办法:
- 一种是通过哲学或者心理学的方法,从外部观察人的行为来推测人是以怎样的智能方式在思考;
- 另外一种是把人脑切开看看神经解剖结构,并且通过脑活动检测技术和精心设计的实验来发现智能活动的规律。
当我们对智能有了一个认识(未必正确、但至少有了模型),那怎样把机器变得智能就需要数学家、计算机科学家、自动化专家去钻研。所以,人工智能相关的学科很多,除了软的理论、模型和算法,还需要依赖硬件落地,比如说需要芯片去给它提供强有力的计算和存储。对于机器人这种智能体,还需要有复杂的系统控制技术支撑。
现在这一波人工智能的热潮,实际上也是受益于目前最新的计算和存储的改进。神经网络技术来自于脑的神经元结构启发,但它跟脑的处理过程完全不一样。它是通过大规模的数据去训练,然后机器从数据中学习一些内在的规律,形成一个模型,再用这个模型去推测新的数据。这称为一个机器学习的过程,它需要很多的存储和计算能力,而我们现在正处于一个非常适合它大发展的时代。
为什么非常合适呢?因为受益于摩尔定律,过去20年硬件的能力获得大幅发展,其中单位成本的计算能力提高1.5万倍、存储能力提高3万倍。通讯技术从有线发展到无线,现在正向5G迈进。这意味着我们不仅可以让智能机器具有强大的大脑,在需要的时候还可以灵活利用云端的能力。云、端结合释放持续学习和改善的能力。
而 AI 的算法像深度学习,通过统计和大数据迎来一个非常大的飞跃,它在图像识别还有语音识别上已经超越了人类的能力。而且我们看到更大的数据也成为了可能,例如一辆无人驾驶汽车一天就产生4TB 的数据,而且是不同源的、异构的数据。有了这些数据以后就要考虑怎样去处理它来产生实时的价值,提供可靠、高质量的服务。
现在深度学习一枝独秀,但是处理这么多种数据完成目标任务只靠这一类算法是不够的。所以,NN+X 就代表要让神经网络加各种新的技术,并且要正视人工智能算法的局限性。引用一下机器人界也是人工智能学界的大牛 Rodney Brooks 教授(人工智能专家,行为学派杰出代表,美国国家工程院院士,iRobot、Rethink Robotics 创始人,Baxter 之父,MIT CSAIL前主任)的观点,他主张先不去管用什么样的逻辑模型或者什么样的神经网络模型去模拟人的思维过程,而要通过实际的智能体去感知,然后去研究怎样通过全系统优化去做出正确的反应。他认为特别是产业界不要沉迷于某一种技术,重要的是根据实际需要去使用技术,为人类提供价值。他认为第一轮AI可以提供的价值是在五年左右,在辅助驾驶和自动驾驶这个领域,第二轮就是十年左右,可以在助老机器人领域提供很大的社会价值。
关于在机器中加入智能能力,整个产业界是在分三步走。
- 首先是把一些不联网的设备连了网,连网以后设备就有了信息传递和更新的能力,同时它也可以结合社交服务提供客户价值。但这个还不算多么智能,只算把设备互联了。
- 第二步就是我们现在所处的智能设备这个级别,其实就是手机上能够提供的这些智能服务,把视觉、听觉识别的能力加进去,再结合数据挖掘技术和知识库提供服务。这些智能机器能够听和看,但还不是听懂和看懂。
- 终极目标是第三步,就是自主机器。
现在我们基本上已经跨越了第二步,正在向第三步迈进。但这个发展过程不是线性的,因为从第二步到第三步会越来越复杂,不仅要理解环境和行为,还要能理解人的情绪。因为机器人服务的是人,如果不能理解人的情绪、达到交流共识的话,就没法提供很好的服务。
从CT到RT,需要人工智能技术与其它技术紧密合作完成“感知-认知-执行”的人机交互闭环
智能机器人就是典型的自主系统。如上图所示,从现在的计算机技术(CT: Computer Technology)到未来的机器人技术(RT: Robot Technology),需要人工智能技术与其它技术紧密合作完成“感知-认知-执行”的人机交互闭环。机器人工作在一个开放的环境里,服务的是不愿遵守刻板交互规则的普通消费者。从整个交互过程来讲有很多不确定性,没有AI算法能够保证不出问题,因此必须结合其它技术来满足消费者对智能机器人的预期。我认为智能交互(SI)是最佳选择,因为它可以充分通过机器人的移动性和主动交互能力来利用人这个通用智能体去补足人工智能。
举两个例子来说明智能交互的威力。我们知道在视觉识别物体的时候,角度和遮挡都会影响识别效果。对于机器人来讲,它可以利用移动性主动选择一个好的角度、避开遮挡来准确识别物体。再进一步,在场景理解的时候,对于能够准确分割的物体,如果不能确信是什么的话(例如凳子还是茶几),机器人可以主动组织一个问句来询问人。由此我们可以看出,灵活利用机器人的主动移动和交互能力可以显著提升整体服务能力,促进智能机器人的产业化。
总结
简而言之,我认为在智能机器人的商业化迭代方面,首先要保证服务能力达标,然后在这个能力要求下选择合适的人工智能算法,配合灵活的智能交互的方案一起去达成这个能力。 随着算法能力和硬件技术的提高,在保持服务能力的前提下,逐步扩大 AI 的比重,是通过商业化发展推动AI技术发展的正循环之路。
雷锋网特约稿件,未经授权禁止转载。