Arm GPU首次支持硬件光追,带着手机也能进入元宇宙?
Arm正在模糊虚拟和现实的界限,连发布会的开场也开在虚拟世界,移动设备离元宇宙将越来越近。
雷峰网消息,本周Arm发布最新的面向移动端的计算产品组合,包括两款CPU(高性能Cortex-X3、高效性能Cortex-A715),三款GPU(Immortalis G715、Mali-G715、Mali-G615)。
最值得一提的旗舰级GPU产品Arm Immortalis(中文意思“不朽”),这是Arm GPU的全新系列,Immortalis G715也是Arm首款移动端支持硬件光线追踪(Ray Tracing)的GPU。当然,也是Arm能够将移动设备作为元宇宙入口的关键。
相比GPU实现新的里程碑,Arm在市场上最有优势的移动CPU产品,看起来没有达到去年预计的未来两年CPU性能提升30%的目标。
不过,要满足游戏、元宇宙、AI等对于计算不断提升的需求,还是需要CPU、GPU等组合的异构计算。因此,Arm在今年同样强调全面计算解决方案(TSC22),TCS22相比上一代能够实现28%的性能提升,16%的能耗降低。
更有意思的是,从Arm透露的产品路线图看,Arm已经准备好冲入元宇宙的时代。
硬件光线追踪进入移动终端
GPU并非Arm的传统强项,但其在移动设备市场依旧具有强大的市场统治力, Arm Mali GPU 出货量已超过 80 亿颗 。因此,Arm推出硬件级别光线追踪移动GPU,对于移动市场光线追踪生态的发展,和光追的普及将具有重要价值。
Arm 高级副总裁兼终端事业部总经理 Paul Williamson直言,Arm推出的全新旗舰级GPU 产品Immortalis,是 为了满足移动应用与游戏对于硬件与性能的新需求。
过去几年间,无论是高通、联发科这样的移动SoC提供商,还是小米、OPPO、vivo等手机OEM,都看准了手游市场的机会,将提升GPU以及游戏体验作为卖点。手机上可以玩越来越多视觉效果出色的3A游戏。
游戏之外,AR、VR、MR,以及元宇宙都对视觉体验提出了更高要求。
显然, 无论是桌面端还是移动端GPU都需要迈向下一个阶段 ,而Arm Immortalis无论从命名还是性能都是面向新时代的产品。
Immortalis传承了Mali GPU的技术积累,相比上一代Mali-G710,I mmortalis-G715性能提升15%,能耗节省15%,机器学习性能提升2倍 ,是Arm迄今为止性能最强的GPU。
高性能会同时带来功耗的挑战,对于使用电池供电的移动设备,对功耗又极其敏感,如果不能控制好功耗,就无法带来良好体验。对此,Paul Williamson表示,Arm 的光线追踪单元只占用了约 4% 的着色器核心面积, 仅耗费非常小幅的功耗,就能在相关领域带来3倍性能提升。
图中左侧为未开启光线追踪,右侧为开启光线追踪
Arm也给出了基于其光线追踪GPU的效果展示,以及峰值性能及FPS/W性能。据悉,Arm的光线追踪实现是基于标准的 Vulkan API,开发者的可及性非常高。
除了支持硬件光线追踪的Immortalis GPU,Arm还同时推出了Mali-G715和Mali-G615,Mali G715相比Immortalis-G715主要的差别是不支持硬件光线追踪,只有7-9个着色器内核(Immortalis-G715有10-16个)。
定位高端的Mali-G615(去年推出的Mali-G610的更新产品)的着色器内核数量为1-6个。2022推出的新款GPU均具备的可变速率着色 (Variable Rate Shading) 图形功能,能够在降低能耗的同时,提升游戏性能。
相比GPU支持硬件光线追踪的亮点,Arm的CPU产品更新就缺乏亮点。
新一代CPU性能提升未完全达到预期
2021年,Arm推出了面向新十年的Armv9架构,并推出了首代基于新架构的一系列CPU产品。去年,Arm预计,新一代架构Armv9将保持超过业界CPU性能提升的速度, 未来两代移动和基础设施CPU的性能提升将超过30%。
当时Arm高级副总裁、首席架构师兼技术院士Richard Grisenthwaite还表示,“这个数据是根据业界标准评测工具来衡量,30%的算力提升完全是凭借于本身架构而不是借助于制程工艺来实现。”
今年推出的全新Arm Cortex-X3,与最新款的安卓旗舰智能手机(运行的上一代Cortex-X2的SoC)相比,性能提升25%,与主流笔记本电脑处理器(Intel Core i7 1260p 28w)相比,性能提升了34%。
这也就意味着, Arm去年预计的性能提升在今年并未完全实现 ,毕竟相比上一代Cortex-X2的性能提升未达到30%。
作为Arm移动端的性能标杆,也是定制CPU项目,Cortex-X3进行了一系列的技术升级,解码器每周期指令从5个提升到6个,乱序执行窗口从288提升到320个,整数ALU单元从4个提升到6个,L2缓存容量也从512KB提升到了1MB。
性能提升的同时,Cortex-X3的功耗表现应该也会成为今年旗舰安卓手机关注的焦点。
将被更广泛使用的新一代CPU是专注于高效性能的 Arm Cortex-A715,与上一代Cortex-A710 相比,性能仅提升5%,能效提升 20%,可以媲美Cortex-X1的性能。
为了兼顾能效表现, Cortex-A715的CPU集群采用了基于大小核 (big.LITTLE) 的配置。
另外,去年推出的Armv9架构高效小核CPU Arm Cortex-A510也迎来更新, 性能不变的同时将功耗降低5%, 并且更新版的DSU-110所支持的CPU集群内核数增加50%,实现了不同等级消费级设备的可扩展性。
从Arm在Cortex-A715中引入大小核配置提高能效,以及更新版Cortex-A510降低功耗,都表明A rm移动端CPU目前在性能和功耗的平衡中所面临的巨大挑战, 这也是手机SoC设计公司和手机OEM都希望Arm能够提升的部分。
Paul Williamson告诉雷峰网 (公众号:雷峰网) ,“性能和功耗要做好平衡,涉及到的因素非常多。我们与合作伙伴共同致力于在芯片以及SoC设计两方面做出最佳的选择。同时,我们也与操作系统厂商和其他软件生态系统的伙伴合作,确保软件开发能够充分利用整个系统的资源。”
Arm冲向元宇宙
从2021年开始,Arm就更加强调全面计算的重要性。
Paul Williamson指出,“ Arm全面计算解决方案专注于设计的可扩展性,这也是我们能通过GPU的配置 ,满足广泛应用的需求。 例如,我们可以使用少量的核心数来实现非常高效和紧凑的设计,也可使用大量的核心数来实现终极的视觉体验。在 CPU 集群中,我们可以采取类似的方法,针对每个应用采用不同的 CPU并进行不同的配置。”
CPU、GPU、AI加速器组合的异构计算正变得越来越重要,Arm面向未来十年,也正在规划全新的产品线进一步提升其全面计算产品组合。
Paul Williamson透露, Arm在大核 CPU 产品线中我们有新的项目Hunter和Chaberton,GPU产品线有Titan和Krake。 同时还在投资系统 IP,以确保低延迟的内存路径和系统级缓存性能。
想要将计算和应用推向新的时代,软件生态和开发者也不可缺少。开发者可及性方面,Arm在不断提升Arm计算库和Arm NN框架,确保开发者能访问硬件性能。Arm也在持续提升安全性能。
其中非常值得关注的是应用程序转向64位,中国主要的应用商店已表明,到今年 8 月,所有新上架的应用都应该是64位,没有过渡到64位的应用会因为性能欠佳让用户感到失望。Arm全新的CPU产品中,也仅有Cortex-A510还支持32位。这也在一定程度上表明,从硬件到应用,Arm都在为XR和元宇宙做准备。
而Arm也已经准备好冲向元宇宙的新时代。
雷峰网原创文章,未经授权禁止转载。详情见。