悟空这一棒,打开了数字世界的立体交互新时代 | 速途网
“头戴凤翅紫金冠,身穿黄金锁子甲,脚踏藕丝步云履,手拿如意金箍棒。”这几天,《黑神话:悟空》凭借着顶级的游戏质量与酣畅淋漓的战斗,成为玩家们津津乐道的话题。
在令人惊叹的视觉效果背后,离不开先进技术的加持与赋能。据大模型之家了解,为了打造《黑神话:悟空》这款作品,游戏制作团队得到了利亚德·虚拟动点提供的专业空间计算-定位捕捉技术服务支持。
在角色动作上,制作团队通过实时捕捉演员的动作,以1:1的比例记录下真实人物的神态、身体姿势和行动细节。对2D图像进行快速的3D重建,并通过准确识别标记点,运算输出标记点质心数据。反馈系统则通过算法计算,实时驱动动画形象,确保游戏中虚拟形象的实时交互。
可以说,在游戏角色栩栩如生的动作表现背后,空间计算技术发挥了不可或缺的作用。而伴随着技术的迭代,空间计算技术的应用也在不断拓展,正为我们的生活带来更多的便利和惊喜。
历程:空间计算被技术发展选择
纵观信息技术与数字技术的发展历史,人与硬件的人机交互方式总是朝着更加自然的、符合直觉的方向发展。比如,智能手机应用的触控交互,就要比电脑的鼠标、键盘的操控交互自然得多,这是过去十几年中,移动互联网生态取代PC生态的重要原因之一。
自2003年麻省理工学院媒体实验室的Simon Greenwold首次提出“空间计算”概念以来,这一领域的发展便引起了广泛关注。 Greenwold在其论文中阐述了空间计算的核心理念,他指出:“空间计算是一种人机交互形式,使机器能够处理和操控真实物体及空间的相关信息。它是实现让机器成为我们在工作和娱乐中更为全面伙伴这一愿景的关键途径。”并强调,空间计算涉及机器对空间内真实物体的识别、定位和操纵,从而促进了人类与机器之间的交互。
空间计算的出现,标志着人类首次以“立体”的方式进入数字世界,而非传统的“平面”交互,这一变革突破了传统交互手段的局限,打破了二维屏幕的限制,通过整合语音、视觉、手势等直观的输入方式,空间计算技术突破了传统鼠标、键盘、触摸屏等交互手段的局限,使用户能够根据自身生理特性和环境需求,实现更为自然、高效的沟通与操作。
在2024数博会上,中国工程院院士刘韵洁深入探讨了数算融合网络的发展趋势及其应用前景,并着重指出了空间计算将作为推动未来技术进步的关键力量。尽管目前可能还没有得到足够的重视,但可以预见到这一领域将有巨大的应用潜力。
如果算力能够更广泛地介入和分布,中国在虚实结合的消费领域场景中将有机会占据重要市场份额。这意味着,随着空间计算技术的成熟和成本的降低,中国市场有望在这一领域实现领跑。
此外,在2024年初,工业和信息化部等七部门联合发布的《关于推动未来产业创新发展的实施意见》中明确提出,需加强前瞻性规划与部署。该意见要求紧密跟踪全球科技创新与产业发展动态,重点推动未来制造、未来信息、未来材料、未来能源、未来空间以及未来健康等六大领域的产业发展。同时,计划建立未来产业瞭望站,运用人工智能、先进计算等前沿技术,精确识别并培育具有高增长潜力的未来产业。
重塑:现代体育事业背后的“技术赋能”
空间计算技术作为一种前沿科技,已在游戏产业、影视行业以及机器人、无人机、自动驾驶等领域展现出强大的赋能能力。
在影视产业中,空间计算技术的应用主要体现在虚拟预演、动作捕捉、虚拟摄影和特效制作等方面。通过虚拟预演,导演和制作团队能够在虚拟环境中预先探索拍摄场景和角度,提高拍摄效率和创意表达。动捕技术则将捕捉演员的真实动作,转化为数字角色的动作,使得数字角色的表现更加自然和逼真。此外,空间计算技术还被用于特效制作,帮助创建复杂的视觉特效,增强影片的视觉冲击力。
图为虚拟动点OptiTrack产品为《狮子王》电影进行虚拟预演
利亚德集团CMO、虚拟动点董事长兼CEO刘耀东曾向大模型之家透露,如今家喻户晓的《三体》《流浪地球》和《封神》等影视大作中,那些精彩的动作与特效,均有空间计算技术的加持。 此外,在2019年版的《狮子王》电影制作中,实时虚拟预演技术的应用使得导演能够在虚拟环境中自由探索,寻找最佳拍摄角度,并通过VR技术进行实时拍摄预览。
近年来,数字人直播也成为空间计算技术在影视产业中的一个新兴应用,通过创建数字人进行直播活动,降低了直播成本。2023年,数字人市场规模便已突破2800亿元。
而在游戏产业中,空间计算技术的应用则主要集中在实现高拟真性、去中心化、永续性和无边界性游戏体验,以及应用光线追踪技术提升视觉效果等方面。 例如全球知名的游戏《NBA 2K》和《使命召唤》中,都有虚拟动点动作捕捉技术的身影。
除了在大众娱乐领域大放异彩,空间计算也深入到了更多场景,不仅提高了工作效率,也为人们的生命安全保驾护航。
图为虚拟动点OptiTrack空间计算进行无人驾驶系统与平台的搭建
7月,“萝卜快跑”无人驾驶网约车在武汉走红,让自动驾驶技术再次成为热议话题,也让行业关注到了空间计算技术的重要性。车辆通过高精度传感器如激光雷达、摄像头和毫米波雷达实现对周围环境的实时感知,构建出周围环境的三维地图,辅助系统做出安全高效的驾驶决策,并与车路协同结合,实现精准定位和导航,优化交通流量。
随着技术的不断进步和市场的逐步成熟,无人驾驶车辆预计将在未来的交通系统中扮演更加关键的角色,为人们提供更安全、更高效、更便捷的出行解决方案。空间计算技术的商业应用和市场接受度上也将获得巨大的提升。
在工业场景中,空间计算技术同样展现出广泛应用前景,特别是在机器人、无人机等前沿科技领域,是实现“具身智能”的关键环节。
以企业为例的话,利亚德集团旗下的虚拟动点已与众多国际和国内知名企业建立合作关系,包括Meta、波音、字节跳动、阿里巴巴等。 这些合作涵盖了从个人应用到工业制造业,从小型桌面场景到大型空间环境的多个层面,印证了空间计算技术已在不同行业和领域得到广泛应用,且具备更加值得想象的增长空间。
加速:AI将成为空间计算新的助推器
在当前人工智能技术的迅猛发展背景下,尤其是以大模型为代表的深度学习技术,空间智能技术应运而生,为理解物理世界提供了新的理论框架和实践路径。
图为”AI教母”李飞飞
作为“空间智能”这一技术的重要推动者,被誉为”AI教母”的李飞飞将空间智能比作实现人工智能全面理解物理世界的关键,并将其作为自己的创业方向。 她通过创建ImageNet数据库,为计算机视觉研究提供了大量数据,促进了深度学习的发展,在实践层面上通过创业公司将其转化为具体的应用和技术解决方案,为AI在现实世界中的应用开辟了新的可能性。
空间智能作为人工智能的一个重要分支,致力于使机器能够像人类一样理解和操作三维空间。 这一领域的关键技术包括空间感知、空间推理和空间适应等。通过这些技术,AI系统能够准确地识别和定位物体,理解物体之间的空间关系,以及预测物体在空间中的运动轨迹。
然而,在空间智能的发展过程中,想要打造更“懂”物理世界交互的大模型,就需要如何高效地获取和利用大规模、高质量的数据。
目前,虚拟动点在空间计算领域已经沉淀了 OptiTrack 光学识别计算、Lydcap 无标记点识别计算、LYDIA 动作大模型三种核心算法技术,解决方案已经覆盖包括影视、游戏、体育、文化艺术等九大行业,数字人交互、无人驾驶、机器人具身智能等数十种场景应用。
图源:利亚德·虚拟动点
特别是作为Optitrack 光学算法的补充技术, Lydcap 无标记点识别算法由虚拟动点研发团队自主研发完成。 该套算法成本更低,部署调试极为便捷。现场无需佩戴任何设备,可同时实现对多人进行空间识别与分析,未来的使用场景将更加广泛。
而虚拟动点自研的全球领先的空间动作数据AIGC专业大模型—— LYDIA 动作大模型,具备对空间动作数据的“认知、感知、预测、生成”等核心能力,支持多模态生成,包括文生动作和音乐生成动作。 区别于其他视频生成类模型,LYDIA 动作大模型的最大优势在于其可实时生成 3D 动作数据,同时可实现私有化、云化部署,以满足不同用户不同场景下的使用需求。
空间智能技术正日益成为重构人工智能理解物理世界效率的关键因素,同时展现出广泛且深远的应用潜力。随着技术迭代和应用场景的扩展,空间智能有望成为推动人工智能技术革新与发展的核心动力,为人类社会的进步与繁荣开辟崭新路径。
在未来,我们可以预见空间智能将在诸多领域扮演至关重要的角色。例如为工业领域提升自动化程度;为自动驾驶领域实现安全高效的自主导航;让智能家居提供个性化的生活体验;在医疗领域为机器人辅助手术的操作能力奠定基础……在技术迭代的同时,也将激发相关产业的创新活力与升级转型。
在大模型之家看来,站在技术爆发的风口上,空间计算技术正在持续突破在各行业领域的应用边界,引领着虚拟与现实世界无缝融合的全新交互范式。