机器人技术Robotics 2.0(1):AI重新定义机器人

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

本文将揭开新世代AI 机器人的神秘面纱,并分析AI机器人将如何影响我们的未来。

机器人技术Robotics 2.0(1):AI重新定义机器人

人工智能开启了新一代机器人技术Robotics 2.0,最大改变是从原先人工编写程序而来的自动化,迈向了真正的自主学习。 本文将尝试揭开人工智能(AI)应用的神秘面纱,协助读者了解AI机器人将如何影响我们的未来,并厘清我们常常听到,但却着墨不多、甚至根本尚未全然理解的主题。

本文为「Robotics 2.0」系列文章的第一篇,讲述机器人技术与AI对于各大产业和未来工作的影响。 我们将讨论AI将如何释放机器人技术的潜力,这项新技术的挑战和机会,以及这一切将如何影响我们的生产力、就业状况、甚至日常生活。 在人工智能被大肆宣传的当下,我们希望透过这些文章鼓励更有建设性和全面性的探讨。

01 重新定义机器人:揭开次世代AI机器人Robotics 2.0的神秘面纱

提到机器人,我们总有各式各样天马行空的想象:从Softbank(软银集团)的社交机器人Pepper、能轻松后空翻的Boston Dynamics公司机器人Atlas、《魔鬼终结者》(Terminator)系列电影的人造人杀手,到电视影集《西方极乐园》(  West World)中随处可见、栩栩如生的拟真机器人角色。

我们常常听到两极化的观点;有些人倾向高估机器人模仿人类的能力,认为机器终将取代人类,有些人则对新研究和技术的潜力太过悲观。

在过去一年之中,许多创业、科技、新创业界的朋友都曾问过我,在AI,尤其是深度强化学习和机器人技术的领域,究竟有哪些「实际」进展?

令人最为好奇的是:

AI机器人和传统机器人有什么不一样?  AI机器人是否真有颠覆各大产业的潜力? 它的能力和限制又是什么?

看来,想要了解现在的技术进步和产业格局,是出乎意料的困难,更不用说要对未来做出预测。 藉由这篇文章,我尝试揭开人工智能应用于机器的神秘面纱,厘清这个我们常常听到,但却着墨不多、或根本未全然理解的主题。

首先必须回答的基本问题:什么是AI机器人(AI-enabled Robotics)? 它们又有什么独特之处?

02 机器人演进:从自动化到自主化

「机器学习解决了以往『对计算机困难,对人来说却容易』的各种问题,或以更容易理解的方式来说,就是解决了『人类很难让计算机也理解』的问题。 」

——Benedict Evans,安霍创投(a16z)

AI所造就的机器人技术领域,最大成果是从原先的「自动化」(工程师藉由程序设计编写规则,让机器人遵守)迈向了真正的「自主学习」。

如果机器人只需要处理一件事情,那么,它到底有没有人工智能,差别其实看不出来;但是,如果机器人需要处理各式各样的任务、或是响应人类与环境的变化,就需要一定程度的自主性才能胜任。

我们不妨借用下列不同等级的自驾车定义,一并解释机器人的演变:

  • Level 0 —无自动化 :由人类操作机器,没有机器人的参与。 (机器人的普遍定义,是指有能力自行从事复杂动作的可程序化拟人机械)。
  • Level 1 —单一自动化运作 :单一功能已自动化,但不使用环境信息。 这是自动化与制造业中传统的机器人使用现况。 透过程序编辑,机器人能够以高精度与速度重复执行特定工作;但直至目前为止,多数实际运用的机器人都无法感知或应变环境的变化。
  • Level 2 —部分自动化 :透过环境感知所输入的特定功能,协助机器进行决策。 例如某些机器人透过视觉传感器,识别并应付不同的对象:然而,传统的计算机视觉,需要对每个对象进行预先登记和清楚的指示,且机器人还是缺乏处理变更、意外状况、或是新对象的能力。
  • Level 3 —条件式自主 :机器控制了所有的环境监控行为,但仍需要人为检查关注与(实时)介入。
  • Level 4 —高度自主 :在某些情况下、或是定义的区域内完全自主。
  • Level 5 —完全自主 :在任何状况下均可完全自主,不需人为介入。

03 我们现在处于哪一种自主等级呢?

现在,工厂里多数机器人都是透过开放式回路、或是非回馈方式予以控制。 这意味着它们的运作与传感器回馈各自独立、彼此互不影响(level 1)。

少数在工厂中的机器人,会根据传感器回馈而调整操作(level 2);此外还有协作型机器人(cobot),他们的操作更加简单安全,因此能与人类共同作业。然而,相较于产业用机器人,这种机器人的精确度和速度却相形失色。

另外,虽然协作型机器人的程序化相对简单,但它们仍然不具有自主学习性;每当工作内容或环境有所变动时,就需要由人类手动引导协作机器人进行调整,或是重新编写程序,机器本身无法自主举一反三,弹性应变。

深度学习(Deep Learning)和强化学习(Reinforcement Learning)能帮助机器人自主处理各种对象,将人类的介入程度降到最低。

我们已经开始看到一些使用AI 机器人(level 3/4)的前导试行项目,例如「仓储拣货」就是一个很好的例子。 在货运仓库中,员工需要根据客户需求,将数百万种不同的产品放入箱子里。 传统的计算机视觉没办法处理如此广泛的物品类别,因为每个物品都需要事先登录、并针对机器人需要采取的动作,先进行程序设计。

然而,现在由于深度学习和强化学习技术,机器人能够开始自主学习处理各种对象,降低人类的介入程度。 在机器人的学习过程中,可能会出现它未曾遇过的某些货品,而需要人类的协助或示范(level 3)。 但是,随着机器人搜集更多的数据、从试验和错误中学习(level 4),算法也将日益改善,迈向完全自主。

就像自驾汽车产业一样,机器人新创公司也采取了不同的策略:有些公司看好人类和机器人之间的合作,专注于level 3的研发;有些公司则相信,机器终将实现真正的完全自主,于是他们跳过level 3,直接着眼于level 4、甚至到level 5。

这也是为什么我们很难评估现在产业自主程度的原因之一。

新创公司有可能自称致力于研究level 3/4的自主系统,但实际上却是大量委外,以人工远程操控机器。 在无法了解其内部软件及AI产品发展程度的前提下,光从机器外观看不出远程操控和自主学习的差别。 另一方面,目标为level 4/5的新创公司,万一无法在短时间取得理想结果,可能反而降低了客户的早期采用意愿、并导致早期阶段的数据搜集更加困难。

在本文的后半部分,我将进一步讨论新创公司的不同的商业策略思考。

04 AI机器人的崛起:运用范围不再局限于仓储管理

有趣的是,机器人的人工智能应用潜能甚至高于无人车,因为机器人有各式各样的应用与产业,因此从某种意义上说,机器人理当比汽车更容易实现level 4目标。

AI机器手臂开始在仓库中被采用,就是最好的例子。 因为仓库属于「半受控」的环境,不确定性相对低。 另外,拣货作业虽然关键、但能容许错误。

至于自主居家型或手术机器人,则要等到更遥远的未来才能实现;毕竟相关环境的变量更多,且有些任务具备不可逆性,以及一定程度的危险性。 但是,可以预见的是,随着技术精度、准确性、可靠性的与时俱进,我们将看到更多产业采用AI机器人。

许多产业还没有使用机械手臂,主要原因在于传统机器人和计算机视觉的限制。

目前世界上只有大约300万台机器手臂,其中大多数从事搬运、焊接、装配等任务。 到目前为止,除了汽车业和电子业以外,仓储、农业和其他产业,几乎都还没有开始使用机械手臂;主要原因,就在于上述传统机器人和计算机视觉的限制。

在接下来的几十年中,随着深度学习(DL)、强化学习(RL)、以及云端技术释放出的机器人潜力,我们将看到新一代机器人带来的爆炸式增长、并改变产业格局。 其中,AI机器人的成长契机有哪些? 新创公司和现有业者,又采取了哪些不同的方法和商业模式,来因应新科技带来的变化?

05 新世代AI机器人新创公司产业概况

接下来,我会介绍不同市场区隔中的几间范例公司。 这样的概略介绍,当然无法涵盖所有企业的状况;欢迎你提供其他公司及应用案例,一起让内容更加完备。

机器人技术Robotics 2.0(1):AI重新定义机器人

AI/Robotics新创公司市场概况(作者提供)

06 垂直应用与水平应用

研究新世代机器人新创产业结构,可以看到两种截然不同的商业模式。

1. 垂直应用

第一种是垂直应用:硅谷当地多数的新创公司,专注于为特定的垂直市场开发解决方案;如电子商务物流、制造业、农业等等。

这种提供完整解决方案的作法相当合理,毕竟相关技术还处于萌芽阶段;公司不依赖他人提供关键模块或组件,而是建构端对端的解决方案。 这种垂直整合的解决方案能更快进入市场,也能确保公司更全面掌握终端用户的案例与效能表现。

但是,要找到像「仓库分拣」这样相对容易实现的应用案例,则没有那么容易。 仓库拣货是相对简单的工作,客户的投资意愿与技术可行性都较高,而且每个仓库几乎都有相同的拣货需求。

但在其他产业(如制造业)中,装配任务可能因工厂而各不相同;另外,在制造业中执行的任务,也需要更高的精度和速度,技术上相对困难。

目前具有学习能力的机器人,仍无法达到与封闭回路机器人相同的精度。

尽管机器学习能让机器人与时俱进,但目前透过机器学习运作的机器人,仍无法达到与封闭回路机器人相同的精度,因为它需要累积尝试错误的经验,从错误中学习,逐渐进步。

这点说明了为什么 Mujin 和 CapSen 机器人这样的新创公司,并未采用深度强化学习,反而选择使用传统计算机视觉。

然而,传统计算机视觉要求每个对象都要事先登录,终究还是缺乏扩充和适应变化的能力。 一旦深度强化学习(DRL)达到了效能门坎、逐步成为产业主流,这种传统方法终究会变得无用武之地。

此外,这些新创公司的另一个问题,在于它们的价值往往遭到高估。 我们经常看到,新创公司在硅谷筹集了数千万美元资金,却无法承诺创造出任何真正具体的收入流。

对于创业者来说,「描绘」深度强化学习的美好未来,再容易也不过了;但现实则是,我们还需要数年的时间才能达到如此的成果。 尽管这些公司离创造获利还有一段距离,硅谷的创投仍愿意继续押宝在这些人才优秀、技术先进的团队上。

2. 水平应用

另一方面,水平应用则是更实用、却比较罕见的模式。 我们可以简单将机器人技术简化为感测(输入)、处理、驱动(输出)三个部分;除此之外,还有开发工具。

(这里使用的「处理」一词,同时概略涵盖了控制器、机器学习、操作系统和机器人模块等等,各种不属于感测或驱动的其他项目 )

我认为未来,这个领域将最具增长潜力。 对于机器人的用户来说,破碎而零细的市场是棘手的问题;因为所有的机器人制造商,都各自推展自家开发的语言和接口,使得系统整合商与终端用户,都很难将机器人与相关系统进行整合。

随着产业的逐渐成熟,有越来越多机器人应用到了汽车和电子厂以外的领域;因此我们更加需要标准的操作系统、通讯协议、接口,从而提高效率、并缩短上市时间。

举例来说,美国波士顿的几家新创公司正在研究相关的模块;例如 Veo  Robotics 公司开发的安全模块,能让工业机器人更安全地和人类协同工作; Realtime Robotics   公司则提供加速了机械手臂路径的解决方案。

 

作者:Bastiane Huang,拥有近10年产品及市场开发管理经验,目前在旧金山担任 AI/Robotics新创公司产品经理,专注于开发机器学习软件,用于机器人视觉和控制。

本文由 @Bastiane 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自Unsplash,基于 CC0 协议。

随意打赏

提交建议
微信扫一扫,分享给好友吧。