王田苗黄铁军巅峰对话:AI+具身智能,产业未来将走向何处
11月25日,由创业黑马主办的 “第15届创业家年会” 在北京举办,年会主题为“AI给世界一个确定性”。
会上,北京大学信息科学技术学院教授、北京智源人工智能研究院院长黄铁军和北航机器人所名誉所长、中关村智友研究院院长王田苗就 《AI+具身智能,重塑产业未来新格局》 这一前沿话题,进行巅峰对话。
黄铁军在对话中表示, 以大模型为代表的时代是确定的,企业要在产业生态中找到自己的位置。 他认为:“这么多企业在创造一个智力时代,就像今天电力时代一样,电力系统背后有千千万万的企业,大型智力时代背后也有千千万万的企业。”
王田苗在对话中表示,AI赋能制造产业有很多突破,但核心技术上还有很长的路。他认为:“‘机器换人’是一个不可替代的趋势,对人形机器人需要理性看待,要更多关注于核心技术突破。”
以下为创业家&i黑马编辑过的对话节选:
王田苗: 感谢创业黑马的邀请,今天有机会能跟北大科学家黄铁军进行对话学习。我简要介绍一下铁军,他在人工智能方面设计发明了脉冲视觉,目前该技术正应用于人工智能感知大模型。而且他和宏江(张宏江 北京智源人工智能研究院理事长)老师创立了北京智源人工智能研究院,被誉为中国AI大模型的“黄埔军校”。
黄铁军: 谢谢王老师,过奖。我和王老师是多年的好朋友,今天很高兴一起讨论AI具身智能话题。邀请我的话,我觉得特别合适,我做AI,王老师做机器人,我们俩加在一起,就是智能的未来。
王田苗: 最近科技圈在讲“AI宫斗”,其背后的原因是什么?
黄铁军: 确实关注度非常高,我的看法很清晰,这就是一个AI风险和AI红利之间的争论。从科学家研究者角度来说,AI确实到了一个危险的边缘,通用人工智能有两种理解,一种叫GAI(通用人工智能,即具有通用性的人工智能),一个叫AGI(人工通用智能,即全面超越人类的超级人工智能),这两者有着根本不同。通用人工智能希望能赋能千行百业,带来巨大的商业利益。AGI是全面超越人类智商,这件事不能随便追求。这次斗争,就是从“通用智能商业加速”和“AGI要来了,对人类造成颠覆性、毁灭性影响的担心” 两种观念的交锋。
王田苗: 这次OpenAI它的首席科学家Ilya Sutskever与创始人Altman之间的“斗争”,能不能理解为创新型企业发展到一定程度,会自然上升到企业发展的哲学层面来思考,比如创立这家企业的哲学理念是什么,这其中有联系吗?
黄铁军: 确实是。当然我们在商言商,企业是社会的一部分、是人类的一部分、是未来的一部分。哲学和商业因素都要考虑,尤其是AI发展这么快的情况下,商业利益和风险要同时重视。
王田苗: 一般来说大模型该怎么定义?或者说参数到达多少才能称之为大模型?现在统计中国有200多个大模型,美国有60多个,请给我们科普一下。
黄铁军: 这个没有绝对的数字,一般认为几百亿,比如五六百亿之后就是具有涌现能力的新阶段,我们称作大模型。
王田苗: 达到500亿以上的中国大模型,有多少家呢?
黄铁军: 我们测试了一部分,也不全面,能做到千亿参数不会超过10家。
王田苗: 美国呢?
黄铁军: 美国比我们少,美国的集中度要高,几千亿、上万亿参数的大模型,有三四家。
王田苗: 从AI基础性大模型再跑三五年,您觉得中国这10家都会存活吗?
黄铁军: 我2021年就说过,全部存活不太可能。基础性大模型企业全球就三五家,中国2家--3家就不得了了。
王田苗: 按你所说从200家存活到50家,50家到10家,10家到3家,假如要你给中国大模型的企业家两个最重要的忠告,让他们跑赢这种竞赛,会是什么?
黄铁军: 首先这不是说哪两家活下来,哪两家成功,别人就失败了,不是这个逻辑。这么多企业在创造一个智力时代,就像今天电力时代一样,电力系统背后有千千万万的企业,大型智力时代背后也有千千万万的企业,只是说像“国家电网”这种公司不会有很多家,而不是说这个产业链上的企业不会有很多家。现在是百模大战,我相信大部分企业都会在未来的生态中找到自己的恰当位置,只不过不是“国家电网”。
王田苗: 你的意思是说,最后会分化,在一个生态链上,找到自己的恰当位置。
黄铁军: 是的。
王田苗: 假如创业者的初衷还是希望成为“国家电网”,你能给我们想成为基础型大模型“国家电网”的建议吗?
黄铁军: 还在形成过程中,今天讲的大模型都是造发电机,“国家电网”还没有出现。我们要跳出商业角度看这个问题,自古以来,盐、铁、水、电,以及未来的智力,都是公共资源和社会基础性服务,不会让一家企业垄断谋取超额利益。这次OpenAI+微软试图想占据这个位置,但这会带来很多问题,所有行业大大小小的企业把数据交一个企业去垄断,让它获取利益,已经不是一个纯粹的商业问题。
王田苗: AI革命让我们经常睡不着觉。我听说,谁能把握客户的流量,谁就拥有了第一张入场券。第二,谁能跟算力公司形成战略合作伙伴,这是第二个入场券。第三,深刻理解国家政策,拿到合规资源,这是第三个入场券。第四是商业运营,用AI能打透某一个高频场景,获得现金流,这是第四个入场券。你同意这种观点吗?
黄铁军: 王老师说得很清楚,这些入场券都是提高自己竞争能力和占据更好地位的重要台阶,但这些都不一定是决定未来产业生态的因素。即便这些入场券你都拿到了,你也不一定能成为AI的产业头部。
王田苗: 明白,所以这里有很多的不确定性。
黄铁军: 有很多不确定性,但最确定的是,以大模型为代表的时代一定会到来。未来十年红利期和经济社会的大幅提升,这是最确定的。这就像互联网一定会对社会产生影响力,重要的是,你要在里面找到自己恰当的位置。
王田苗: 我是做机器人的,偏重于制造,对通用AI基础大模型,我够不上,但我很关心垂直大模型。我的问题是,像李院士(中国工程院院士、前华中科技大学校长李培根,下同)讲的AI为智能制造带来了革命性变化,就你理解AI在工业界,垂直大模型在哪几个环节需要我们发力,给我们做制造的人一些建议?
黄铁军: 今天讲的基础大模型和垂类大模型,基础大模型是个基础设施,肯定是存在的。垂类大模型会发生很大的变化,如果基础大模型足够强,垂类大模型是不是一个产业形态,都要进行思考。我也想请教王老师,王老师做机器人,确定的一定是有很多实体、具有智能的机器人,比如自动驾驶,这个会大量体现。今年特别火的词是“具身智能”,您怎么看待“具身智能”和机器人之间的关系?
王田苗: 具身智能先从狭义理解,Embodied AI,就像具有智能行为的Agent,广义理解为Embedded AI或Internet AI。所以说具身智能好像AI完成了大模型以后,能够作为一个工具帮助人,或者能够作为人代理使用工具,改变世界,这可能就是通用机器人,人们自然而然就对具身智能和未来的发展产生了特别大的兴趣。
黄铁军: 大家梦想机器人进入家庭,进入工厂和制造业,已经有四五十年了,为什么今天就可能了呢?故事讲了30-50年没讲成,为什么今天有可能了呢?
王田苗: 现在全球机器人的规模在600-1000亿美元,中国正好在1000-1500亿人民币。为什么最近这么火呢?主要有三个原因:
第一是机器人未来人机交互十分重要,所以脑机接口、软体操作灵巧手和可穿戴式人工肌肉、人工皮肤等,这让人们感觉机器人未来的交互可能会带来革命性变化。
第二个原因就是人工智能,特别是机器学习与大模型。机器人分大脑与小脑,大脑是推理、认知和分析,这块大模型即将做到了,这对机器人来说是革命性的。但机器人又是在一个特定任务、高速、高精度、高效操作或移动环境中,必须有一个小脑。小脑需要平衡、速度、精准控制,而且容错率要非常低,不像咱俩对话,我说错了,它可以允许,但机器人操作往往是不允许的。小脑不仅需要人工智能还需要基于感知的智能控制。
第三原因是马斯克说,特斯拉要在5年以内,把现在的人形机器人从100万到200万美元的成本降到2万美元成本。2万美元的成本,让人感觉只要量大,只要让电机、电控、电池、减速器、传感器等核心部件实现批量生产,加上大脑、小脑的突破,具身智能的时代就要到了。
黄铁军: 第一,为什么非要做成人形?第二,你为什么相信人形机器人的聪明程度,可以进入家庭代替一些家务工作,这个靠谱吗?
王田苗: 这个问题很尖锐,从技术和社会商业两个层面来看。先说技术,以人形为代表的平台去探索材料、认知、推理、控制、操作、运动以及带动相关的制造,是具有重要的意义。正因为有这个重要意义,所以国家把它作为未来战略性产业来培育,这是我的理解。
第二个是商业。从目前来看,人形机器人在许多效率方面,并不一定合适,比如充电维护方面,很多环境用到通用机器人,2-3个小时就要充一次电,因为机器人站着不动就要耗电,更何况还有高速或灵巧的动作;另外在很多事情上,机器人很难像人一样,需要大量工程师的安全维护,这是商业化需要去考量的问题。
但AI带来了一个机会,就是通过人机交互,来提醒机器人做什么。这样的话,在非实时性、非结构化环境下,会让机器人按照人的意图去完成人不愿或危险的任务,比如在传染病环境中作业,比如核工业危险物品的搬运和操作等,这些痛点往往需要机器人。
另外,我们的世界、我们的工具、我们的工作与生活环境,一切都是为人设计的。自然人们想象人形机器人在这个环境下替代人,就有它的意义和价值。
我还想再补充两点。第一点,做机器人科学家与工程师还在加班加点熬夜攻克核心技术难题,但是资本市场好像有点过热,有点泡沫。也就是人形机器人还没有成功研制落地应用,还没有在产业化验证,还有成本、效率、安全等等卡点,可是二级市场对具有人形机器人概念上市企业或核心部件企业,它们股价却已经上来了。另外人形机器人在一定程度上会涉及到伦理,比如我想让人形机器人到家里陪护、聊天、生活,这在伦理上还有争论。
黄铁军: 我不做机器人,我有点不同意你说的资本市场有泡沫。现在的人形机器人要加大投入,而且咱俩加在一起,这件事就佐证了这点。AI实际上是为机器人装一个大脑,提高它的认知能力。大模型已经对家里各个物件的物理性质、危不危险、杯子抓得紧一点还是松一点、液体不能倒在地上等有了认知,机器人装上大模型以后,就会解决之前多年不能解决的问题。当然机器人的身体是必不可少的,所以往机器人关键部件去投入,是没问题的,当然也不作为投资依据,我认为这是一个很好的时机。身体做好了,现在大脑也快准备好了,加在一起,机器人真的能进入千家万户。
王田苗: 你的观点我非常认同,机器人在中国正在以20%-25%的复合增长率加速发展,全世界增速是8%-12%。所以“机器换人”是一个不可替代的趋势,只是对人形机器人的发展要更加理性,要更多关注于核心技术突破。我是指人形机器人在有些地方,想象得过于乐观。跟现实的人,无论从情感温度、灵巧、安全性来说,还是有相当的距离。我把它看成未来前沿技术和产业的重要方向。
黄铁军: 我也理解,因为做AI的人站着说话不腰疼,只要有数据就能训练。真要做身体,真不容易,所以难题交给王老师们,做硬件、做高精度传感器、做电机驱动......
王田苗: 说到AI对机器人的变革,我最近也看了很多AI文章,也听了李院士对AI在制造业变革的报告,有一些思考。
我们把制造业分成三段,第一段称为设计端,第二段是规划和操作端,第三段是物流和客户端。我发现AI在产品规划、设计端、仿真端,它的贡献率将超过30%以上,在物流和客户服务端,也会超过了30%。在车间规划端和协调资源端,贡献率大概是25%。而对我们的机器人在焊接、抛光、上下料、喷涂等,这个方面的贡献率是百分之十几。
为什么在高速、高精度的操作端贡献没有这么高呢?
我个人觉得李院士的报告非常深刻。机器人操作,有一定的挑战,这里面主要有三个问题。一个问题是,它要求容错率非常低。第二,实时性要求特别高。有时候一个动作要在10毫秒或20毫秒有反应,如果把算力放在云上,都对实时性提出了更高的要求。
李院士说非结构化环境里增加视觉3D建模,这会比过去,只有工程师才能编程的抛光打磨,效率提高了5-10倍,也就是过去需要3天到4天的工作量,比如说换一个轮毂,之前的工作任务是抛光、打磨,是固定化的。如果换一个不同车型,通过人工智能和3D实时视觉识别,它能够由3-5天变成半小时-1小时,极大提高了效率。
黄铁军: 这确实是我们应该做的,就是AI跟制造过程、生产过程、产业过程紧密结合。我现在真的很担心,如果AI大模型更大、认知能力更强,会带来巨大的风险。大家开玩笑,之前希望机器人端茶送水扫地,现在它吟诗作赋绘画了。如果冲着提高认知这个方向,让它的数学能力、推理能力、对金融市场的操控能力、对国家决策支持能力这个方向走,真的会很危险。不如好好去做些实实在在的工作,到工厂去提高效率、提高质量,到家庭去做家务、照顾老人,这确实是应该做的,基于中国有这么一个巨大的产业基础,应该去推进。
王田苗: 最后一个问题,创业从对社会的价值贡献和成功率角度来理解,你觉得学院派(来自于研究院、高校)和企业派,甚至是投资派,这几个角色之间,谁领导谁更有效?
黄铁军: 这个问题王老师更有经验,我自己的感受,还是各自发挥所长。比如在美国,有大家都知道的政策或实践经验,就是学院派做好学院派的事,产业派做好产业派的事,分工合作。在中国的环境里,当然还在发展过程中,就是有点完全商业主导。当然最终要商业主导,但把研究人员和科学家变成精明的商人,这是不现实的。我期望让他们发挥好作用,但今天还不容易做到。
王田苗: 我非常认同,如果认为这个时代对某些行业变化太快,需要很多资源,往往一定是商业主导,成功率大,比如电商里的亚马逊,因为要整合很多资源,而且变化很快。第二,对于硬科技商业化,往往需要长时间,基本上是要有工程师或高管组合专注打磨,这方面企业高管出来创业,成功率大。而科学家要不然做好桥梁作用,要不然做细分赛道,比如新材料、新试剂、核心算法等,这些重要依赖于科技的成果,原因是在实验室完成的东西,直接进入到社会工业界比较短,不需要中间的采购、商业资源整合等等环节,成功率比较大。
黄铁军: 王老师说得对。不同产业界的情况不太一样。因为中国科技这么多年的发展,真的是不同于以前了。以前电商做商业模式创新可以很成功,但今天确实要竞争创新,AI时代、机器人、具身智能,创新是特别核心的要素。而且中国的大学、研究机构积累了很多创新,甚至是国际顶尖创新,但这些创新的转化率还不高。我从学校、从科研机构来讲,期望投资界能更多关注这些点。这些点可能不是那么成熟,但它是企业长期发展的核心竞争力,我们要有硬科技,要有核心竞争力,这是将来在国际上长期立得住的重要支撑。期望投资界和产业界支持,特别感谢!
王田苗: 我听懂了,在硬科技时代,科技创新与产业需要科学家和工程师积极参与,有责任、有期待、有使命,只是还要思考怎么和社会更好地合作。谢谢黄老师,谢谢大家!