自研Oryon CPU,让高通「进」可攻「退」可降维打击
2023年高通骁龙峰会自研的Oryon CPU首次亮相时,超越x86阵营里的最强者,也力压当时最强的苹果M2 Max处理器。
即便在x86阵营以及苹果2024款PC处理器发布之后,首代Oryon CPU的性能依旧处于领先地位,让高通 CEO安蒙在2024高通骁龙峰会说的:“高通一直是引领无线产业的发展的公司,如今我们将高通转型为一家面向新AI处理时代的连接计算公司。” 的说法更有说服力。
本周高通骁龙峰会正式发布的搭载第二代Oryon CPU的骁龙8至尊版,性能的大幅提升,有一些对同行实现了降维打击的意味。
骁龙8至尊版是唯一在Geekbench单线程测试中超过3,200分的Android SoC,在Speedometer上超越了所有Android竞品,也是业界唯一一款在任何操作系统上都能在Geekbench多线程测试中突破10,000大关、在安兔兔测试中突破300万大关的移动SoC。
一边是领先手机领域的竞争对手,另一边大幅增强了汽车市场的竞争力。搭载专为汽车定制Oryon CPU的骁龙座舱至尊版平台和Snapdragon Ride至尊版,CPU性能提升高达3倍。
“Oryon是完成我们整个SoC的最后一块拼图。” 高通技术公司高级副总裁兼手机业务总经理 Christoper Patrick在骁龙峰会上说。
Oryon CPU显然成为了高通保持在手机市场领导力,提升在智能汽车市场竞争力,以及突破PC市场的核心之一。
此时再回看2021年高通收购NUVIA,很难不感叹高通的战略水平以及技术实力的高超。
当然, “重构”作为2024年高通骁龙峰会的主题, Oryon CPU并非唯一的主角,骁龙8至尊版全面升级的NPU、GPU以及AI ISP都值得特别关注。
Oryon CPU对高通的战略价值
即便我们已经进入了AI时代, AI能力是所有计算公司都重点强调的能力,但不要忽略CPU的重要性。
如果把手机SoC比喻成一个交响乐团, CPU是指挥家的角色,指挥每个音符、每个节奏、每个乐器创作出完美的AI交响乐。
CPU对于管理系统层面的处理至关重要, 它能执行来自应用程序、操作系统和用户输入的指令,确保运行流畅快速,也可以运行高端游戏、视频编辑软件、AR体验、AI和机器学习以及安全等复杂应用。
过去数代骁龙处理器的CPU是采用Arm的IP,对于当时的高通这是一个非常合适的选择。
转变发生在2020年,苹果发布的基于Arm架构自研的初代M系列PC处理器强大的性能震撼业界,这对高通是一个启发。
2021年,高通以14亿美元收购了NUVIA,开启了从头开始设计一款CPU。
高通技术公司手机、计算和XR事业群总经理阿力克斯·卡图赞(Alex Katouzian)表示,“高通之所以收购NUVIA,是希望能够我们自己设计出适用于手机、PC、汽车等多个领域的CPU架构。”
对于高通,自研CPU必须考量投入产出比,如果只是为手机和PC从头开始设计全新的CPU可能还欠缺些许吸引力,那加上汽车市场,自研CPU的投入产出比预期就会十分理想。
“汽车对于算力的需求还在不断增长。这也是我们收购NUVIA的必要原因之一。”阿力克斯·卡图赞说。
虽然高通骁龙8155在2021年初高通收购NUVIA的时候还未被众多消费者熟知,但智能汽车座舱功能的快速迭代,让高通座舱处理器的CPU面临挑战。
有手机、PC这两个全球出货量最大的两个市场作为支撑,再加上需求不断增加的汽车市场, 让高通有足够的动力自研CPU。
2023年让初代Oryon CPU在PC上亮相是一个绝佳的策略,不仅可以达到让高通的PC处理器达到一鸣惊人的效果吸引注意,还能用这个对高通营收占比不大的产品线先验证性能强大的Oryon CPU。
接着,2024年Oryon CPU推向高通最熟悉的手机市场,经过PC市场验证的Oryon CPU,用到手机上几乎就是降维打击。
2025年Oryon CPU再开始用到对性能和安全性要求更高的汽车市场,高通自研CPU不仅成为了其业务的重要支撑,也非常好的服务其公司战略。
阿力克斯·卡图赞在峰会期间透露,“Oryon CPU是每年都会更新,因为会应用在手机、汽车、PC等领域,面向PC的骁龙处理器计划每两年更新一代。”
“ Oryon CPU的迭代和微架构并非严格绑定关系 ,两者会以各自的节奏迭代, 同时也取决于产品线。第二代Oryon CPU就是专为移动场景打造,在第一代Oryon CPU微架构的基础上重新设计,两者有很大的相似性,但第二代更实用且有更出色的能效。”阿力克斯·卡图赞对雷峰网表示。
全面重构的骁龙8至尊版,性能跨代提升
CPU微架构和内存系统大升级
此时更容易理解骁龙8至尊版性能大幅提升的源头。
相比第三代骁龙8商用手机, 骁龙8至尊版商用机在室温环境下测试, 单线程和多线程基准测试中性能有高达45%的大幅性能提升,能效提升也高达44%。
同样相比第三代骁龙8,Oryon CPU在Chrome浏览器上的性能提升超过62%。
“在整个Android生态系统中处于领先地位,这是一个跨代际的提升。 “阿力克斯·卡图赞表示,“能效也提高了44%,这是骁龙的与众不同之处。”
“高通Oryon CPU正是拼图的最后一块。我们从头开始打造IP,这种方式赋予了我们对CPU的完全自主权。让我们能够直接定义和定制所有处理通道的配置,不需要任何外部依赖。”高通技术公司产品管理总监Manju Varma表示。
第二代Oryon CPU有两个最高主频高达4.32GHz的超级内核 ,适合应对需要更快响应速度的密集型应用,以及6个Oryon性能内核负责运行最密集型的应用程序,同时具有极高能效,没有任何一个传统意义上的效率内核。
“多年来,我们已经减少了效率内核的数量,最终用乱序性能内核取而代之,它们能够提供最佳性能和功耗组合,这是骁龙8至尊版能面向实际用例树立性能新标杆的原因。”Manju Varma解释。
值得注意的是,骁龙8至尊版超级内核CPU的最高主频4.32GHz已经超越了骁龙X Elite最高3.8GHz的主频,性能也超越了竞品的PC CPU性能,这种设计的考量是什么?
“展示骁龙8至尊版CPU和PC竞品CPU的性能对比,更多是为了展现我们CPU设计的先进性, 从第一代到第二代Oryon CPU我们的内核是逐年提升。”阿力克斯·卡图赞进一步表示,“ PC和手机运行多线程任务的方式不同,在手机上是尽可能压榨频率, 以更少数量的核心支持多线程任务;而在PC上则会降低频率,同时引入更多数量的核心来支持多线程任务。”
“当我们提高CPU频率时,总是会有与之相匹配的功耗降低,在延长电池续航的同时,实现性能增强。”阿力克斯·卡图赞说,“对我们而言, 每瓦特性能比单纯的性能和频率更重要。 ”
拥有高主频还不是Oryon能够大放异彩的全部原因,第二代Oryon CPU还大幅改进了内存架构。
骁龙8至尊版Oryon CPU的每个丛集都拥有12MB的二级缓存,总计24MB紧密耦合的专用缓存是移动领域最大的缓存。同时也大幅提升了一级缓存。
提升缓存大小能带来更强处理能力的同时会带来时延增加的问题,“ 经过精心设计并采用先进的缓存一致性协议,可显著降低时延,提高整体性能并实现更低功耗。”Manju Varma表示。
考虑到生成式AI对内存的高度依赖,骁龙8至尊版也配备目前业界最高速的10.7Gbps的LPDDR5内存。
第二代高通Oryon CPU的微架构和内存系统升级带来了更快的应用启动速度、无缝的多任务处理和先进的生成式AI功能,还有视频渲染速度将大幅提升,这让游戏成为了最大的受益用例。
首创切片架构Adreno GPU
骁龙8至尊版能够处理高要求游戏工作负载,包括CPU密集型物理模拟。 凭借Oryon CPU,将能够体验到战斗对可破坏环境的影响,以及环境中的湍急水流、衣袂飘飘、翠绿花园、微风拂尘。
另外,利用骁龙8至尊版的全部CPU内核, Oryon CPU能在5毫秒时延内处理超过1000个物体破坏和碰撞的情景。
“我们的Adreno GPU也经过完全重新设计,最大限度地提高性能和能效,这对移动游戏至关重要。”阿力克斯·卡图赞分享,对比第三代骁龙8商用智能手机,对于图形密集型游戏,骁龙8至尊版性能将提升40%,功耗降低40%,光追性能提升35%。
得益于骁龙8至尊版首创的切片架构Adreno GPU,充分考虑了手游玩家需求,全新高通Adeno GPU能够提供基于着色处理器的独立内核,能实现更佳工作分配和并发性能。
通过扩展性能提供更高的时钟频率,当渲染复杂场景时,可以直接在GPU上存储12MB数据,减少向骁龙8至尊版DDR发送的图形数据,带来更锐丽的图像和更流畅的游戏体验,实现更长久的持续游戏体验。
即将在12月发布的《超级房车赛:传奇(Grid Legends)》移动版将独家支持高通自适应性能引擎4.0,这一引擎能引擎将提高终端能效,提供稳定的终端性能。
骁龙8至尊版还提供了更多下一代游戏体验。 虚幻引擎5的Nanite解决方案首次在移动端运行,目前仅在骁龙平台上提供支持, 在终端侧渲染栩栩如生的环境。
基于全新设计的GPU,在网易《永劫无间》手游极致画质下,与前代平台相比,骁龙8至尊版的平均帧数提升22帧,帧率稳定性提升43%。
这一游戏是首个游戏内终端侧大语言模型,玩家可以用语音口令与AI队友互动,帮助玩家优化构筑、协调即将到来的作战行动,向新玩家提供策略来帮助学习游戏。
此时就不得不提再次进化的包含CPU、GPU、NPU的异构架构高通AI引擎。
Hexagon NPU更好地支持多模态大模型
“如果Oryon CPU是一个出色的指挥家,负责同时运行多个应用,负责启动所有AI工作负载,处理繁重负载任务。 那Hexagon NPU就是那个令人惊叹的小提琴手,它将在AI最激烈的演奏高潮成为舞台中央的焦点。 ”高通技术公司产品管理高级总监Siddhika Nevrekar这样形容。
与第三代骁龙8相比,全新架构的Hexagon NPU性能提升45%,能效提升45%。结合全面提升的CPU和GPU,骁龙8至尊版能够跨所有核心动态管理AI负载。
NPU性能的大幅提升来自一系列重大改进,包 括提升了所有加速器内核的吞吐量,实现更快的AI推理性能。增加的标量内核数量可以支持更长内容,达到4k上下文窗口,增加的向量内核可以加强对大语言模型和传统AI的支持。
MLPerf基准测试显示,骁龙8至尊版的性能在所有模型上都超过了第三代骁龙8,基础基础大语言模型上的token生成速率提升了高达100%,目前业界流行的一些大语言模型上,骁龙8至尊版的处理速度达到超过70 tokens/s,可以加速AI助手运行速度。
“在高通AI引擎的性能合奏中,这次我们引入了更多艺术家,其中一位就是内存并发性。正如交响乐中的音乐家一起完美合奏,AI和计算机视觉工作负载现在可以同时访问一个内存空间并协同工作,创造流畅有趣的体验。”Siddhika Nevrekar补充表示。
这也是为了更好支持AI智能体。 AI智能体底层依靠多种先进AI模型支持, 包括自动语音识别(ASR)、大语言模型(LLM)、大视觉模型(LVM)和全新多模态大模型(LMM)。
“每个模型都是各自领域的专家,它们能够协同工作,为用户提供无缝的个性化服务。”Siddhika Nevrekar说,“这些模型在高通AI引擎的不同内核上运行,它们像训练有素的团队一样运作,确保一切任务都能流畅高效地运行,这就是异构计算的魔力。”
为了充分发挥高通AI引擎的强大,高通也改进了AI软件。 高通第一次能够让开发者骁龙8至尊版上利用高通AI Hub测试最新模型。
高通也与众多合作伙伴一起推动端侧AI的发展,最新的合作是与腾讯混元合作,基于骁龙8至尊版移动平台,共同推动了腾讯混元大模型7B和3B版本的终端侧部署。
智谱在GLM4v-mini上创建了基于多模态大模型的AI助手, GLM-4V端侧视觉大模型能够实现令人惊叹的处理能力,以超过70 tokens/秒的速度在基于骁龙8至尊版的终端侧高速运行。
AI ISP与NPU直连,视频也能有消除功能
全新升级的NPU让视频AI也成为了可能。
“以前,ISP会先处理图像,然后发送到NPU进行后处理。”阿力克斯·卡图赞介绍,“ 现在,处理管线将更加紧密配合。NPU可以直接访问RAW原生传感器数据,在4K60fps下实现基于AI的实时增强。 ”
高通同样为骁龙8至尊版重新设计了ISP,升级为AI ISP,性能全面提升,ISP吞吐量提高了近35%,能效提升高达25%。升级后的强大性能支持用户利用多达三个4800万像素传感器同时进行拍摄。
高通技术公司产品市场资深经理Carina Affinito说,“我们还升级了关键组件,带来更好的单帧逐行HDR对齐、时域降噪和自动对焦硬件。面向3A——即自动对焦、自动白平衡和自动曝光,还新增了AI辅助的增强功能。这些意味着图像质量的全面提升。”
充分利用Hexagon NPU可以在4K 60fps下进行实时处理的特性, 高通将先进的AI算法直接引入图像和视频处理管线的核心,高通称之为“Insight AI”, 可以将摄影提升到全新高度。
其中一个功能无限语义分割支持对图像进行超过250层语义识别和分割,分割完成后可以对肤色和天空实时识别并修正;另一个功能是AI补光,可以在视频通话或者直播时添加虚拟可移动光源。
高通也与虹软合作,展示了全新宠物摄影特性套件,手机能自动对焦跟踪宠物的眼睛,拍出最好的照片。
除了照片,骁龙8至尊版的AI ISP结合NPU也能将照片的消除功能用于视频,并且全部在终端侧运行。
与去年一样,骁龙8至尊版的首发将会是小米。
骁龙汽车平台在高通内部地位更高
2024年的高通骁龙峰会罕见的用了一天的峰会来重点介绍骁龙数字地盘, 包括全新的骁龙座舱至尊版平台和Snapdragon Ride至尊版平台。
与骁龙8至尊版一样,全新的骁龙汽车平台同样采用专为汽车定制的高通Oryon CPU。
高通技术公司汽车、行业解决方案和云事业群总经理Nakul Duggal告诉雷峰网 (公众号:雷峰网) , “为汽车定制的Oryon CPU主要是在安全性方面进行增强,提供更高的安全系数。”
与前代顶级平台相比,全新平台的CPU速度旨实现在提升至3倍,AI性能旨在实现性能提升至最高12倍。
值得注意的是,高通为软件定义汽车提供灵活性和可扩展性,汽车制造商可以选择在同一SoC上无缝运行数字座舱和智能驾驶功能。也就是说骁龙座舱至尊版平台和Snapdragon Ride至尊版平台有许多相同的IP,且具备扩展性。
Nakul Duggal认为灵活的架构是高通发展舱驾一体的优势所在。
另外,新的平台满足汽车安全标准ASIL-D,支持超过40个多模态传感器,包括多达20个高分辨率摄像头,实现360度全方位覆盖和车内监测。
骁龙座舱至尊版平台和Snapdragon Ride至尊版平台将于2025年出样,理想汽车和梅赛德斯-奔驰公司将会率先在量产车型中采用骁龙至尊版平台。
高通也宣布了与谷歌达成多年战略合作,提供先进生成式AI赋能的解决方案以打造安全的先进数字化车内体验。
从PC到手机再到汽车,高通自研的Oryon CPU充分支撑了高通公司的新战略,也让高通转型成为计算和连接的领导者。
雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。