机器人技术Robotics 2.0（1）：AI重新定义机器人

人人都是产品经理 • 5年前扫码分享

本文将揭开新世代AI 机器人的神秘面纱，并分析AI机器人将如何影响我们的未来。

人工智能开启了新一代机器人技术Robotics 2.0，最大改变是从原先人工编写程序而来的自动化，迈向了真正的自主学习。本文将尝试揭开人工智能(AI)应用的神秘面纱，协助读者了解AI机器人将如何影响我们的未来，并厘清我们常常听到，但却着墨不多、甚至根本尚未全然理解的主题。

本文为「Robotics 2.0」系列文章的第一篇，讲述机器人技术与AI对于各大产业和未来工作的影响。我们将讨论AI将如何释放机器人技术的潜力，这项新技术的挑战和机会，以及这一切将如何影响我们的生产力、就业状况、甚至日常生活。在人工智能被大肆宣传的当下，我们希望透过这些文章鼓励更有建设性和全面性的探讨。

01 重新定义机器人：揭开次世代AI机器人Robotics 2.0的神秘面纱

提到机器人，我们总有各式各样天马行空的想象：从Softbank（软银集团）的社交机器人Pepper、能轻松后空翻的Boston Dynamics公司机器人Atlas、《魔鬼终结者》（Terminator）系列电影的人造人杀手，到电视影集《西方极乐园》（ West World）中随处可见、栩栩如生的拟真机器人角色。

我们常常听到两极化的观点；有些人倾向高估机器人模仿人类的能力，认为机器终将取代人类，有些人则对新研究和技术的潜力太过悲观。

在过去一年之中，许多创业、科技、新创业界的朋友都曾问过我，在AI，尤其是深度强化学习和机器人技术的领域，究竟有哪些「实际」进展？

令人最为好奇的是：

AI机器人和传统机器人有什么不一样？ AI机器人是否真有颠覆各大产业的潜力？它的能力和限制又是什么？

看来，想要了解现在的技术进步和产业格局，是出乎意料的困难，更不用说要对未来做出预测。藉由这篇文章，我尝试揭开人工智能应用于机器的神秘面纱，厘清这个我们常常听到，但却着墨不多、或根本未全然理解的主题。

首先必须回答的基本问题：什么是AI机器人（AI-enabled Robotics）？它们又有什么独特之处？

02 机器人演进：从自动化到自主化

「机器学习解决了以往『对计算机困难，对人来说却容易』的各种问题，或以更容易理解的方式来说，就是解决了『人类很难让计算机也理解』的问题。」

——Benedict Evans，安霍创投（a16z）

AI所造就的机器人技术领域，最大成果是从原先的「自动化」（工程师藉由程序设计编写规则，让机器人遵守）迈向了真正的「自主学习」。

如果机器人只需要处理一件事情，那么，它到底有没有人工智能，差别其实看不出来；但是，如果机器人需要处理各式各样的任务、或是响应人类与环境的变化，就需要一定程度的自主性才能胜任。

我们不妨借用下列不同等级的自驾车定义，一并解释机器人的演变：

Level 0 —无自动化 ：由人类操作机器，没有机器人的参与。 (机器人的普遍定义，是指有能力自行从事复杂动作的可程序化拟人机械)。
Level 1 —单一自动化运作 ：单一功能已自动化，但不使用环境信息。这是自动化与制造业中传统的机器人使用现况。透过程序编辑，机器人能够以高精度与速度重复执行特定工作；但直至目前为止，多数实际运用的机器人都无法感知或应变环境的变化。
Level 2 —部分自动化 ：透过环境感知所输入的特定功能，协助机器进行决策。例如某些机器人透过视觉传感器，识别并应付不同的对象：然而，传统的计算机视觉，需要对每个对象进行预先登记和清楚的指示，且机器人还是缺乏处理变更、意外状况、或是新对象的能力。
Level 3 —条件式自主 ：机器控制了所有的环境监控行为，但仍需要人为检查关注与（实时）介入。
Level 4 —高度自主 ：在某些情况下、或是定义的区域内完全自主。
Level 5 —完全自主 ：在任何状况下均可完全自主，不需人为介入。

03 我们现在处于哪一种自主等级呢？

现在，工厂里多数机器人都是透过开放式回路、或是非回馈方式予以控制。这意味着它们的运作与传感器回馈各自独立、彼此互不影响（level 1）。

少数在工厂中的机器人，会根据传感器回馈而调整操作（level 2）；此外还有协作型机器人（cobot），他们的操作更加简单安全，因此能与人类共同作业。然而，相较于产业用机器人，这种机器人的精确度和速度却相形失色。

另外，虽然协作型机器人的程序化相对简单，但它们仍然不具有自主学习性；每当工作内容或环境有所变动时，就需要由人类手动引导协作机器人进行调整，或是重新编写程序，机器本身无法自主举一反三，弹性应变。

深度学习(Deep Learning)和强化学习(Reinforcement Learning)能帮助机器人自主处理各种对象，将人类的介入程度降到最低。

我们已经开始看到一些使用AI 机器人（level 3/4）的前导试行项目，例如「仓储拣货」就是一个很好的例子。在货运仓库中，员工需要根据客户需求，将数百万种不同的产品放入箱子里。传统的计算机视觉没办法处理如此广泛的物品类别，因为每个物品都需要事先登录、并针对机器人需要采取的动作，先进行程序设计。

然而，现在由于深度学习和强化学习技术，机器人能够开始自主学习处理各种对象，降低人类的介入程度。在机器人的学习过程中，可能会出现它未曾遇过的某些货品，而需要人类的协助或示范（level 3）。但是，随着机器人搜集更多的数据、从试验和错误中学习（level 4），算法也将日益改善，迈向完全自主。

就像自驾汽车产业一样，机器人新创公司也采取了不同的策略：有些公司看好人类和机器人之间的合作，专注于level 3的研发；有些公司则相信，机器终将实现真正的完全自主，于是他们跳过level 3，直接着眼于level 4、甚至到level 5。

这也是为什么我们很难评估现在产业自主程度的原因之一。

新创公司有可能自称致力于研究level 3/4的自主系统，但实际上却是大量委外，以人工远程操控机器。在无法了解其内部软件及AI产品发展程度的前提下，光从机器外观看不出远程操控和自主学习的差别。另一方面，目标为level 4/5的新创公司，万一无法在短时间取得理想结果，可能反而降低了客户的早期采用意愿、并导致早期阶段的数据搜集更加困难。

在本文的后半部分，我将进一步讨论新创公司的不同的商业策略思考。

04 AI机器人的崛起：运用范围不再局限于仓储管理

有趣的是，机器人的人工智能应用潜能甚至高于无人车，因为机器人有各式各样的应用与产业，因此从某种意义上说，机器人理当比汽车更容易实现level 4目标。

AI机器手臂开始在仓库中被采用，就是最好的例子。因为仓库属于「半受控」的环境，不确定性相对低。另外，拣货作业虽然关键、但能容许错误。

至于自主居家型或手术机器人，则要等到更遥远的未来才能实现；毕竟相关环境的变量更多，且有些任务具备不可逆性，以及一定程度的危险性。但是，可以预见的是，随着技术精度、准确性、可靠性的与时俱进，我们将看到更多产业采用AI机器人。

许多产业还没有使用机械手臂，主要原因在于传统机器人和计算机视觉的限制。

目前世界上只有大约300万台机器手臂，其中大多数从事搬运、焊接、装配等任务。到目前为止，除了汽车业和电子业以外，仓储、农业和其他产业，几乎都还没有开始使用机械手臂；主要原因，就在于上述传统机器人和计算机视觉的限制。

在接下来的几十年中，随着深度学习(DL)、强化学习(RL)、以及云端技术释放出的机器人潜力，我们将看到新一代机器人带来的爆炸式增长、并改变产业格局。其中，AI机器人的成长契机有哪些？新创公司和现有业者，又采取了哪些不同的方法和商业模式，来因应新科技带来的变化？

05 新世代AI机器人新创公司产业概况

接下来，我会介绍不同市场区隔中的几间范例公司。这样的概略介绍，当然无法涵盖所有企业的状况；欢迎你提供其他公司及应用案例，一起让内容更加完备。

机器人技术Robotics 2.0（1）：AI重新定义机器人

AI/Robotics新创公司市场概况（作者提供）

06 垂直应用与水平应用

研究新世代机器人新创产业结构，可以看到两种截然不同的商业模式。

1. 垂直应用

第一种是垂直应用：硅谷当地多数的新创公司，专注于为特定的垂直市场开发解决方案；如电子商务物流、制造业、农业等等。

这种提供完整解决方案的作法相当合理，毕竟相关技术还处于萌芽阶段；公司不依赖他人提供关键模块或组件，而是建构端对端的解决方案。这种垂直整合的解决方案能更快进入市场，也能确保公司更全面掌握终端用户的案例与效能表现。

但是，要找到像「仓库分拣」这样相对容易实现的应用案例，则没有那么容易。仓库拣货是相对简单的工作，客户的投资意愿与技术可行性都较高，而且每个仓库几乎都有相同的拣货需求。

但在其他产业（如制造业）中，装配任务可能因工厂而各不相同；另外，在制造业中执行的任务，也需要更高的精度和速度，技术上相对困难。

目前具有学习能力的机器人，仍无法达到与封闭回路机器人相同的精度。

尽管机器学习能让机器人与时俱进，但目前透过机器学习运作的机器人，仍无法达到与封闭回路机器人相同的精度，因为它需要累积尝试错误的经验，从错误中学习，逐渐进步。

这点说明了为什么 Mujin 和 CapSen 机器人这样的新创公司，并未采用深度强化学习，反而选择使用传统计算机视觉。

然而，传统计算机视觉要求每个对象都要事先登录，终究还是缺乏扩充和适应变化的能力。一旦深度强化学习(DRL)达到了效能门坎、逐步成为产业主流，这种传统方法终究会变得无用武之地。

此外，这些新创公司的另一个问题，在于它们的价值往往遭到高估。我们经常看到，新创公司在硅谷筹集了数千万美元资金，却无法承诺创造出任何真正具体的收入流。

对于创业者来说，「描绘」深度强化学习的美好未来，再容易也不过了；但现实则是，我们还需要数年的时间才能达到如此的成果。尽管这些公司离创造获利还有一段距离，硅谷的创投仍愿意继续押宝在这些人才优秀、技术先进的团队上。

2. 水平应用

另一方面，水平应用则是更实用、却比较罕见的模式。我们可以简单将机器人技术简化为感测（输入）、处理、驱动（输出）三个部分；除此之外，还有开发工具。

(这里使用的「处理」一词，同时概略涵盖了控制器、机器学习、操作系统和机器人模块等等，各种不属于感测或驱动的其他项目 )

我认为未来，这个领域将最具增长潜力。对于机器人的用户来说，破碎而零细的市场是棘手的问题；因为所有的机器人制造商，都各自推展自家开发的语言和接口，使得系统整合商与终端用户，都很难将机器人与相关系统进行整合。

随着产业的逐渐成熟，有越来越多机器人应用到了汽车和电子厂以外的领域；因此我们更加需要标准的操作系统、通讯协议、接口，从而提高效率、并缩短上市时间。

举例来说，美国波士顿的几家新创公司正在研究相关的模块；例如 Veo Robotics 公司开发的安全模块，能让工业机器人更安全地和人类协同工作； Realtime Robotics 公司则提供加速了机械手臂路径的解决方案。

作者：Bastiane Huang，拥有近10年产品及市场开发管理经验，目前在旧金山担任 AI/Robotics新创公司产品经理，专注于开发机器学习软件，用于机器人视觉和控制。

本文由 @Bastiane 原创发布于人人都是产品经理，未经许可，禁止转载

题图来自Unsplash，基于 CC0 协议。