为啥智能驾驶公司,都在做机器人?
当我们谈起「机器人」的时候,你脑子里第一时间想到的是什么?
你可能会想到「四大家族」和现代工厂里的工业机器人。它们的出现,极大提高了标准化作业的生产效率,并加速了工业全球化的速度。工业机器人操作的核心底层技术逻辑,是被提前写入机器的代码指令。
也正因为如此,在不同的工作场景和任务需求里,上述工业机器人的效率可能呈现两个极端。对于汽车这样迭代周期长的产品来说,它们是高效且稳定的;但如果换成像 SHEIN 这样,以周甚至以天为周期,进行更新的快时尚产品中,为机器人重新编程,远不如纺织线上的熟练工人直接上手来得实用。
所以从长远来看,从局部智能走向全面智能,一定是机器人行业的发展方向。不过,尽管特斯拉、斯坦福等商业巨鳄、世界名校都已躬身入局,智能机器人时代究竟何时到来,依然是一个未知的问题。
其中一个重要原因,就是仅靠少数巨头参与,还远不足以搭建起智能机器人所需的行业生态。智能机器人要满足更多复杂的场景,它需要数字世界和物理世界紧密交互,需要不同软硬件相互协作,需要更多开发者共同参与。
2023 年 7 月 25 日,智能驾驶计算方案提供商地平线在深圳举办了 CodePlay 开发者创享日,希望连接起更多开发者,并以「后端支持者」的身份,为智能机器人的发展提供一套全新的范式。
「从芯片出货量的角度来看,机器人(现阶段)远没有手机那样的庞大市场。」地平线机器人事业部负责人王丛认为,这是一项需要耐心和时间的长周期工作,「但属于你相信未来属于机器计算的话,就值得持续投入。」
王丛在地平线开发者创享日上进行分享 | 地平线 Horizon Robotics
一、为啥做智能驾驶的公司,都在瞄准机器人?
提到同时在智能驾驶和机器人两个领域开展业务的公司,人们更为熟悉的,恐怕是伊隆·马斯克创建的特斯拉。
智能驾驶和智能机器人,在技术原理中有很多共通之处:都是基于对环境的感知和交互,对外界信息进行计算后,指导机器进行运动的过程。然而在实际应用层面,二者还是要面对不同类型、不同等级的数据处理需求和计算能力。
也就是说,智能驾驶和机器人算法的骨架是相同的,但肉身仍有不小的差异。
从规模来说,智能驾驶或自动驾驶往往伴随着高速场景,并且和安全紧密相关,所以需要较高算力的芯片支持实时计算;而智能机器人,在现阶段通常在相对低速环境中工作,相应的计算需求会降低。
不过,从运动控制的维度上,智能驾驶只需要控制 2D 维度的运动;而如「灵巧手」那样的机器人,需要模仿生物体多达 20 个以上的关节运动,就会使得计算和控制难度大增。
此外,智能驾驶过程中面对的数据相对「收敛」——往往是车道线、马路边缘、信号灯等确定的内容;而智能机器人曾需要在不同现在场景中,和多种复杂的物理环境进行交互,数据种类多样且发散,同样会对计算提供不同的考验。
所以,尽管马斯克表示,特斯拉现有的 FSD 技术,可以在未来和机器人模块进行一定程度的算法复用,但仍然只是在「底层模块」中进行,更高阶的计算和场景还是需要针对机器人平台进行专项开发。
特斯拉人形机器人概念图 | Teala
地平线同样是从计算的角度切入智能机器人领域,不过和特斯拉相比,还是有两个显著的不同之处:
1 创业路径
特斯拉的创立,伴随着创始人马斯克「绿色能源」的愿景,进入机器人领域上是因为看到了算法复用的机会;而地平线在创立之初,原本就是想做一家「为机器人造脑」的公司,这一点从地平线公司的英文名「Horizon Robotics」就可以看出。公司现在为业界熟知的智能驾驶芯片业务,被他们描述为智能计算业务的一个「应用场景」。
2 商业模式和定位
特斯拉是一个直接面对 C 端消费者的品牌,它们需要打造的是一个个具体的终端产品;而在和极客公园沟通时,地平线将自己目前在机器人领域的角色,描述为「后端支持者」——他们认为机器人的开发,应该依托于一个开源的平台,吸引更多软件端的开发者,共同完成生态建设。
「地平线则会以芯片和解决方案,占据一个重要的生态位。」
二、从「点」(Node)到「面」(Hub),搭建机器人新范式
7 月 25 日,在地平线的开发者创享日现场,极客公园见到了基于不同应用场景开发的智能机器人。既有消费者比较熟悉的扫地机器人,也有在医疗领域辅助进行甲状旁腺手术切除的检测仪,还有不知道可以用来做什么,但看起上去就很酷的四足「机器狗」。
那么,从 0 到 1 搭建起一个机器人,究竟是怎样的过程?
如果把步骤进行抽象,理论上应该分为以下 3 个阶段:
-
明确需求;
-
开发硬软件功能;
-
实现不同的部件间的相互协同。
但对于开发者而言,最高效的场景决不能是「从零开始」。一些基础的功能应该被略过,真正的创新永远是站在前人肩膀上进行的,不能把时间浪费在重复造轮子上。
举个例子,如果希望开发一个用于山地救援或者工程作业的新产品,有时会希望利用四足机器人的运动优势,那么这个时候,开发者的重心不应该是思考怎样重写代码,实现四足机器人的运动,而是应该专注于新功能的开发,以及思考如何让不同模块真正实现高效协作。
基于此,购买已有的配件或套件,可以解决硬件层面的问题,而搭建系统并进行代码开源,则可以提高开发者在软件层面的效率。ROS 是机器人行业里著名的开源协作的底层系统,它集成了大量的工具软件包、库代码,以及约定协议,让跨平台研究和研发变得更简单。
地平线机器人事业部生态负责人胡春旭,是 ROS 机器人社区「古月君」的创始人,专注于这个操作系统在国内的推广和应用。今年年初,胡春旭正式加入地平线,并且在开发者日发布了地平线的开发者套件 RDK 和基于 ROS 平台的 TogethROS.Bot 第二个版本更新。
根据胡春旭介绍,T.ROS 2.0 版本将在软硬协同、开源算法、配件驱动支持等多个方面进行升级迭代,并且和 RDK 套件进行更深层的绑定。
胡春旭发布 NodeHub 机器人应用开发分享中心 | 地平线 Horizon Robotics
与此同时,胡春旭还在现场发布了全新的 NodeHub 应用开发中心。他希望按照从点到面的方式,为机器人底座的搭建提供一套全新的范式思路。
例如,如果要搭建一台扫地机器人,那么需要先完成环境感知、自主导航、目标检测、运动控制等多个功能「点」的安装和驱动,而这些「点」就像一个个手机 App 一样,被封装进了 NodeHub 的应用商店里,直接被开源下载。
据此思路,胡春旭在现场用了大约 15 分钟时间,即完成了由「点」(Node)到「面」(Hub)的机器人底座搭建。也就是说,除了安装清扫垃圾需要的硬件和程序代码,这个扫地机器人的骨架已经搭建完成。
地平线希望,基于这套全新的范式和方法论,在未来攒出一个机器人底座,让创建机器人「可以像搭积木一样简单」。
发布会现场搭建起的扫地机器人底座 | 地平线 Horizon Robotics
三、和开发者共同成长
除了地平线对机器人开发生态及方法论的探索,让极客公园有些意外的是,有不少在校大学生也在暑假期间到现场参加了这次活动。他们或在展区惊讶于某个产品的设计「很酷」,或在晚宴现场感慨于分享嘉宾的学霸经历。
一个深圳大学的大一新生,敏锐地捕捉到地平线 CEO 余凯在分享时的一句「商业黑话」,抛出了一个有些稚嫩但很有趣的问题:
「作为一名学生,在科研领域里,怎样找到属于自己的『生态位』?」
这位年轻的开发者赢得了全场的掌声和鼓励,而余凯的解答是:「对于年轻人来说,一定要做现在是冷门,明天是热门;现在是非主流,明天是主流的事。」一如他此前无数次面对媒体时的讲述那样,强调「非共识」在创新里的作用。
开发者日现场的年轻人们 | 地平线 Horizon Robotics
而这一问一答,也恰好呈现了机器人开发现阶段在技术和商业层面的处境。开发者未必是严格意义的「创业者」,来自高校领域的爱好者是这个生态未来发展需要争取的人才。
而商业层面上,现阶段跑通闭环的,往往是能执行某些特定任务的「机器」(如扫地、割草、陪伴等领域),而非那种听起来更酷、功能更全的通用「机器人」。 地平线机器人事业部负责人王丛告诉极客公园,他认为未来 2-3 年里,机器人领域不会有像手机一样的爆品出现。也就是说,这依然是一个长周期的项目。
所以在创业第 8 年的时候,地平线又回到了机器人的赛道里,它们也许比创业初期,更清楚地意识到这件事的困难和复杂程度,所以,机器人业务在地平线内部,既是一个技术部门,也可以理解为一个社区平台。和开发者共同成长是选择开源后的必然选择。
余凯说,他在 27 年以前就接触到了机器学习,并认定这将是一辈子的事业,而且此刻仍然在成长和等待。
「重要的是,你相不相信智能手机后,下一个计算时代属于机器人。」