这群极客，在地下参加了一场「机器人死亡挑战赛」

极客公园 • 2年前扫码分享

作者｜周永亮

编辑｜靖宇

谈到移动机器人，你可能经常遇到，比如在酒店、医院、餐饮等服务领域，经常会看到机器人的身影。除此之外，波士顿动力公司 (Boston Dynamics) 的网红机器人，各种摸爬滚打的视频在网络上也吸引了众多关注。

但在一些更复杂、极端的环境下，机器人依旧叫好不叫座，亟待技术层面的深层突破。

这样的局面，曾经的无人驾驶也遇到同样的问题。从 2004 到 2007 年，美国国防部高级研究计划局（DARPA，Defense Advanced Research Projects Agency）赞助了无人驾驶挑战赛。大赛除了捧红了激光雷达公司 Velodyne，同时也直接催生了此后十几年火热的自动驾驶赛道。

遵循同样的思路，2018 年 DARPA 组织了机器人地下挑战赛（Subterranean Challenge，SubT），并设置了 500 万美元的奖金，吸引世界各地的机构和公司的工程师和科学家团队来参加比赛。

这群极客，在地下参加了一场「机器人死亡挑战赛」

DARPA SubT 地下挑战赛决赛结果｜IEEE

如今，此次持续近三年的系列赛已经落幕，最终 CERBERUS 团队和 CSIRO Data61 团队，分别获得决赛的第一名和第二名。

除了比赛结果，这次挑战赛更大的价值，在于对现实的映射。回顾这场比赛中遇到的问题和给出的解决方案，可以更深层地了解机器人发展的动向，以及加速机器人的普及。

机器人的「死亡挑战赛」

谈起举办这次地下挑战赛的直接契机，DARPA 战术技术办公室项目经理 Timothy Chung 表示，这主要考虑到作战人员的需求，以及先遣应急队的需求。他们需要各种地下环境中执行搜索和救援的任务，可能人口密集的事故、自然灾害，也可能是矿山等救援。

同时，在这次挑战赛的官网，引用的克劳塞维茨在《战争论》中的一句话，「战争与地形的关系，要求我们具备快速而精准地获取任何地区地形信息的能力。」

这群极客，在地下参加了一场「机器人死亡挑战赛」

Cerberus 团队的 ANYmal 机器人在自主探索洞穴｜IEEE

在比赛场地的选择上，这次地下挑战赛选取了地下隧道、城市地下、岩洞三个最具挑战性的场景。在这样的环境中，机器人将面临很多极限的情况，比如地形非常复杂，无法使用 GPS，通信受到限制，能见度低，移动性也受到挑战等等。简单说，DARPA 的目标是要寻找能在极端环境下，仍然能够通行的机器人。

据主办方介绍，他们希望参赛团队在四个领域推动机器人技术的边界： 移动性（如何迅速移动）、感知（如何理解外界）、网络（把数据传回服务器）和自主权（机器自主决策）。

这场挑战赛的规则是，参赛团队要搜索、检测比赛场地，找到并定位主办方设置的 10 到 30 件物品的精确位置，这些物品可能包括人体模型、门、电动泵、阀门、背包、灭火器、收音机或手机，以及更多抽象的东西，如煤气泄漏。团队的最终得分主要取决于他们能够找到多少物品，以及用时多长。

与此同时，参赛人员被禁止进入矿洞隧道，所有的工作必须要有参赛的机器人完成。标记精度在 5 米以内，被认为完成了定位，能获得积分。

要想取得比赛的成功，还是非常有难度的。因为涉及到隧道、城市、洞穴等场景，因此需要一个整体解决方案，来实现能力的相对平衡。举个简单例子，机器人需要足够小巧才能通过狭窄通道，但它又需要携带足够大的传感器和计算机，来为自己测绘、导航和作出自主决策；另外，在动力系统方面，机器人需要更加节能，才能在极端环境中行驶数公里，但自主决策和测绘都需要很大的电力需求。

对于这场比赛，官方的称呼是「地下挑战赛」，类似铁人三项比赛，不是要找到最强的游泳、跑步和自行车运动员，而是要三项综合成绩最好的人。很多人觉得这种说法过于委婉，更应该把它称为「机器人死亡挑战赛」或「机器人奥运会」。

「机器人与地下城」

要真正理解这次挑战赛，需要简单回顾一下整个过程。据了解，2019 年 8 月，来自 8 个国家的 11 支机器人团队，汇集在美国匹兹堡的一个矿洞，这是第一次隧道比赛（Tunnel Circuit）的场地。与团队一起出现的，还有 20 架无人机、64 架地面机器人和一架名为 Duckiefloat 的自主飞艇。

这群极客，在地下参加了一场「机器人死亡挑战赛」

参加 SubT 地下挑战赛参赛团队｜IEEE

大部分团队的策略，是先派出机器人侦察、探测环境，然后根据场景和机器人性能，选择合适的机器人完成定位任务。在比赛最开始时，情况还都很顺利。 但意外很快发生，通信成了这次比赛的最大问题。 就在机器人转过矿洞第一个拐角的时候，许多团队失去了与机器人的联系，因为无线电波无法穿透坚硬的岩石。

随后，时间很快来到了 6 个月后，第二场比赛（Urban Circuit）来到了西雅图附近的萨索普核电站。这个核电站始建于 1977 年，建设完成 80% 的时候，政府决定不再投入资金，这个核电站也成了废弃项目。如今，它成为此次挑战赛的场地。

如果说，在隧道挑战赛中，通信是一个巨大的挑战。那在这次城市地下赛道中，通讯已经不是什么大问题。参赛团队进行了升级和迭代，使用可部署的网络节点建立了网状网络。机器人在前进的过程中，每隔一段距离就会放置一个小的通讯机器人，然后它会自行建立起网络节点，这样就可以在通讯范围之外进行长时间的工作。

通信问题解决了，但低温成了问题。 当时，废弃核电站内的温度是-4 摄氏度，甚至比室外（2 摄氏度）还要低。所以，参赛的团队人员和机器人，都无法长期在比赛场地逗留太久，比赛结束手立即转移到温暖的地方。

最终，CoSTAR 依靠更好的性能和表现，在城市地下巡回赛中，总共获得 16 分排名第一，比排名第二的 Explorer 高出 5 分，CTU-CRAS-NORLAB 团队获得第三名。

DARPA SubT 地下挑战赛决赛海报｜IEEE

第三场是洞穴巡回赛，原本要在 2020 年秋季举办，但因为 COVID-19 被迫取消。所以，这场赛事直接跳到了 2021 年 9 月的决赛，地点是在路易斯维尔巨型洞穴，这是一个非常有挑战性的场地。整个洞穴大约有 400 万平方英尺（约 37 万平方米），它的特点是结合了 DARPA 设计的三个场景，有不规则通道和大型洞穴系统，还具有复杂布局的地下结构。

这时，参赛队伍已经从最初的 11 支，减少到 8 支。对所有的参赛队伍来说，自主性是决赛的最大挑战。因为比赛场地不允许团队人员进入，每支团队只有一个人可以对机器人进行远程操控，所以让机器人自行决定去哪里，如何去哪里，将是赢得比赛的关键。

在决赛结束时，CERBERUS 和 CSIRO Data61 两支队伍都发现了 23 件物品。因为用时更少，CERBERUS 团队赢得最终的决赛冠军，拿走了 200 万美元奖金，CSIRO Data61 则获得第二名。

启示和未来

回顾机器人地下挑战赛的三年间，应该是梦想照进现实的三年。CSIRO Data61 团队负责人 Navinda Kottege 在接受采访时曾表示，这次挑战赛最有价值的地方在于，DARPA 刚开始知道机器人并没有这种能力，但要求三年之后，形成一支有竞争力的机器人团队。

最初的想法，也确实变为了现实。在挑战赛开始之前，他们团队确实有一些很炫酷的技术，但没有机器人系统可以可靠地工作一个小时或者更长；但三年之后，他们可以部署机器人，让他们自主地去做一些任务，然后团队成员去做自己手中的工作，这是非常大的进步。

与此同时，这次挑战赛也带来了很多技术层面的惊喜，可能会引领机器人的发展。在这次系列赛中，参赛团队带来了很多形态的机器人，包括六足仿蜘蛛机器人，四轮车型机器人、履带坦克型机器人、飞行机器人等。其中，轮式机器人提供了最可靠的机动性，无人机可以探索一些较大的洞穴。

但最令人印象深刻的是 CERBERUS 团队的四足机器人 ANYmal C，同时在比赛中表现可靠，即便遭遇碰撞也可以保持稳定，完成了团队的大部分工作。

ANYmal C 四足机器人｜IEEE

这款机器人是由瑞士 ANYbotics 公司打造，有点像一只大型犬，重量在 100 斤左右，配备了摄像头、3D 传感器，包括用于 3D 绘图和同步定位和映射（SLAM）的激光雷达，可以执行搜救、检查等任务。移动速度上，它可以达到 1 米/秒，还能轻松处理 20 度的斜坡和 45 度的楼梯，以及跨越 25 厘米的空隙，通过仅有 60 厘米的通道。

更重要的是，ANYmal C 不需要进行艰苦的建模过程，以及危险且高成本的实地测试，就可以应对现实世界复杂的地形地貌。那它是怎么达到的呢？

据团队负责人介绍，在复杂的地形和无法准确探测环境的情况下，机器人必须依赖本体感受（proprioceptive）——在高时间分辨率下感测其自身的身体形态。

为此，瑞士 ANYbotics 公司提出了一种稳健的控制器。这种控制器仅使用联合编码器和惯性测量单元的本体感受度量，这是腿式机器人上最耐用最可靠的传感器。有了新型控制器的加持，这些机器人可以轻松翻越溪流、草地、雪地、碎石坡等富有挑战的场景。

同时，这个控制器由一种神经网络策略驱动，在模拟环境中进行训练。虽然没有任何现实世界的数据和精确的地形模型，但控制器仍然能克服野外的各种不规则地形。研究人员还强调说，「我们的系统可以穿越几乎所有地形，而且一次都没有摔倒。」

除此之外，研发人员还引入了一些新的方法：首先，在模型上，ANYbotics 公司并没有使用当前主流的的多层感知器（MLP），而是使用了序列模型，特别是感受状态的时间卷积网络（TCN）；其次，是关于特权学习（privileged learning）。新模型在训练中分为两个阶段，首先训练教师策略，该策略可以访问特权信息，即对地面的真实了解和机器人与之的接触；随后教师指导纯本体感受的学生控制器学习，后者仅使用机器人本身可用的传感器信息。

此外，这项研究中提到的方法并没有用到摄像头、激光雷达或接触式传感器信息，只依赖本体感受传感器信号（proprioceptive sensor signal）来提高控制策略在不同地形中的适应性和稳健性。

CSIRO 团队测绘的地图精度极高｜IEEE

除了四足机器人，高精度的测绘地图，也是这个挑战赛让人惊喜的地方。在此次挑战赛中，CSIRO data61 团队虽然排在第二位， 但他们的机器人测绘得到的地图，与 DARPA 的真实地图相差不到 1%。

据了解，DARPA 官方的地图，是邀请了专业的技术人员，使用了非常昂贵的设备，花费了 100 个小时进行专业测绘得来。但 CSIRO data61 团队，只用了不到一个小时内，得到的结果就跟官方地图接近。这背后的技术，着实让所有人都很吃惊和好奇。

据了解，在 CSIRO data61 团队背后，有一套叫 Wildcat 的自主机器人的研发平台和工业应用的商业化解决方案。据团队负责人曾介绍说， Wildcat 使用非线性优化算法，将来自机器人传感器的 3D LiDAR（光检测和测距）数据，实时转换为高度详细和准确的环境地图，同时为机器人控制提供更新速率的姿态信息。

机器人可以实时共享地图片段，以帮助他们保持对环境变化的认识，并探索新的领域。这使他们能够轻松地将不同的机器人平台集成到他们的车队中。

Wildcat 利用 CSIRO 十多年的 SLAM 研发经验，该技术与 IMU（惯性运动单元）和 LiDAR 传感器结合使用，可选择添加其他传感器，如化学、放射、气体、GPS 和 Wi-Fi。

目前，Wildcat 解决方案已经开始商业化，无人机公司 Emesent 是其第一个客户，同时它还其他几家公司合作。

几年前，波士顿动力在 YouTube 上传的机器人视频，捧红了旗下的双足机器人和四足机器狗。但是，即便成为了「网红」，波士顿动力辗转于谷歌、软银和现代汽车的命运，也折射出机器人产业的举步维艰。

最近两年，宇树科技等国内创业团队将四足机器人价格做到了万元区间，而小米等巨头公司也开始纷纷押注机器人赛道，可以看出机器人已经成为一个新的风口。但不可否认的是，虽然机器人的价格已经不再「高不可及」，但是其使用场景依然局限于安保等固定场景。

DARPA 机器人挑战赛虽然考验的是机器人在极端环境中的搜寻和施救能力，但正像 15 年前的无人驾驶大赛催生了自动驾驶赛道，机器人大赛中所锻炼出的地形扫描、制图和运动能力，或将很快应用到市面可见的机器人产品中，极大拓展机器人的应用场景，并最终加快机器人向消费电子产品类别的过渡步伐。