拳打苹果、脚踢英特尔,高通芯片才是 AI 的未来
「等一下,等一下,下一张 PPT 你们更想拍!」
北京时间 10 月 25 日凌晨,2023 高通骁龙峰会的开场演讲中,高通公司总裁兼首席执行官克里斯蒂亚诺·安蒙 Cristiano Amon,隆重介绍了骁龙 X Elite Oryon CPU。在 PPT 演示中,新款 CPU 不仅盖过了苹果公司的 M2 Max、英特尔 i9-13980HX 两款目前世上最强处理器,而且峰值能耗比前两者更低。
同时,除了为 X Elite 打响在 PC 端的名号,高通当天还曝光了骁龙 8 Gen 3 处理器。作为最新的移动芯片,骁龙 8 Gen 3 不仅在性能上有所提升, 而且在生成式 AI 处理上也有优化,甚至能直接跑得动百亿参数的模型 。
场内场外,微软、Meta、谷歌、惠普、联想、小米等消费电子巨头 CEO 和总裁纷纷为高通站台。其中,小米集团总裁卢伟冰不仅在现场曝光了即将发布的小米 14 旗舰机,而且正式预告小米汽车将在 2024 年推出。
全新的 PC 系列芯片产品、骁龙 8 Gen 3 芯片,让高通强调的「终端 AI」成为触手可及的现实。
骁龙 X Elite,直怼苹果英特尔
当天全场的焦点,非骁龙 X Elite 莫属。
为了支持未来的高负载智能任务,高通推出公司迄今为止面向 PC 打造的最强计算处理器:骁龙 X Elite,其中 Oryon CPU 直怼英特尔和苹果。
专为 AI 打造的骁龙 X Elite, 集成了全新定制的高通 Oryon CPU,支持在终端侧运行超过 130 亿参数的生成式 AI 模型 ,处理速度是竞品的 4.5 倍,面向 70 亿参数大模型时每秒可生成 30 个 token。据高通称,这款移动计算 CPU 的性能是竞品的两倍,在达到相同峰值性能时,功耗仅为竞品的三分之一。
骁龙 X Elite 面向 70 亿参数大模型时每秒可生成 30 个 token |高通
「赶紧拍照。」高通 CEO 安蒙在峰会上称,Oryon CPU 的单线程性能超过了苹果的 M2 Max 和英特尔的 i9-13980HX,峰值性能功耗比 M2 Max 少 30%,比 i9-13980HX 少 70%。
Oryon CPU 的单线程性能超过了苹果的 M2 Max |高通
Oryon CPU 的单线程性能超过了英特尔的 i9-13980HX |高通
在多线程性能方面, 高通还对比了英特尔的 i7-1355U 和 i7-1360P,称骁龙 X Elite 的性能可达其两倍 ,峰值性能功耗可少 68%;还有英特尔的 i7-13800H,称性能超过它 60%,峰值性能功耗可少 65%。此外,高通还重点对比了苹果的 M2,强调骁龙 X Elite 的性能超过它 50%。
骁龙 X Elite 的性能超过苹果 M2 50% |高通
高通技术公司高级副总裁兼计算与游戏业务总经理 Kedar Kondap 称:「骁龙 X Elite 标志着计算技术创新的巨大飞跃,全新定制的高通 Oryon CPU 性能强悍,将为消费者带来惊人的能效,并将创造力和生产力提升至全新水平。强大的终端侧 AI 将支持无缝的多任务处理和全新的直观用户体验,赋能消费者和企业的创作和发展。」
骁龙 X Elite 性能 |高通
据悉,OEM 厂商预计将于 2024 年中推出搭载骁龙 X Elite 的 PC。
第三代骁龙 8,1 秒生成 Stable Diffusion 图片
峰会上,高通还发布了首个专为生成式 AI 而精心打造的移动平台:骁龙 8 Gen 3。
相比上一代,第三代骁龙 8 的 CPU 性能提升了 30%,GPU 性能提升了 25%,NPU 性能则提升了 25%,支持运行 100 亿参数的生成式 AI 模型。 据称在智能手机设备上运行 Stable Diffusion,只需不到 1 秒就可以用文本生成图像 。
第三代骁龙 8 性能 |高通
高通技术公司高级副总裁兼手机业务总经理 Chris Patrick 称,「该平台将开启生成式 AI 的新时代——赋能用户创作独特内容、帮助生产力提升,并实现其他突破性的用例。」
根据现场演示,骁龙 8 Gen 3 将支持一些便捷和创意的 AI 相机工具 ,包括从视频中移除物体、扩展照片区域以及生成虚拟背景等功能。
身为 Android 旗舰智能手机 SoC 领导者,据悉,第三代骁龙 8 将在全球 OEM 厂商和智能手机品牌的终端上得到广泛采用,包括华硕、荣耀、iQOO、魅族、蔚来、努比亚、一加、OPPO、真我 realme、Redmi、红魔、索尼、vivo、Xiaomi 和中兴。
小米集团总裁卢伟冰也现身夏威夷峰会现场,演示了即将发布并搭载第三代骁龙 8 的小米 14 手机,以及小米「长期 AI 策略成长」。另据其称,小米 14 系列将全球首发第三代骁龙 8 移动平台。
小米总裁卢伟冰在夏威夷骁龙峰会现场 |高通
除了小米,根据各厂商高管的说法,蔚来与高通基于骁龙平台在车和手机上深度合作,电竞手机红魔将搭载第三代骁龙 8,即将发布的真我 realme GT5 Pro 也将搭载这款旗舰芯片,vivo 和 iQOO 均将发布搭载第三代骁龙 8 的旗舰产品,中兴基于第三代骁龙 8 的 nubia 旗舰手机很快将面世。
第三代骁龙 8 性能 | 高通
据高通表示,搭载第三代骁龙 8 的 Android 旗舰终端预计将于未来几周内面市。
「终端 AI」的时代
推动生成式 AI 落地各种品类的终端,包括广泛的消费电子产品,成了高通今年的最大目标。
「 我们正在进入 AI 时代,终端侧生成式 AI 对于打造强大、快速、个性化、高效、安全和高度优化的体验至关重要。 」高通公司 CEO 安蒙说道。
骁龙峰会上发布的骁龙 X Elite、第三代骁龙 8,据称能以极致速度处理生成式 AI 任务,例如,面向 Windows 11 PC 的终端侧聊天助手可实现每秒处理 30 个 token,仅需不到一秒就能使用 Stable Diffusion 在智能手机上生成图像。
从文本到图像、图像到视频和文本到 3D,多模态 AI 的出现正在改变人类与设备互动的方式,根据高通产品管理高级副总裁 Ziad Asghar 的说法:「在终端设备上完全运行,这意味着你可以在飞机上飞行,仍然可以使用生成式 AI。」而且,「这绝对只是这一革命的开始。」
Asghar 称,「云中的生成式 AI 面临许多难题,这些难题可以通过设备上的处理来解决。」例如,一些公司正在将专有代码集成到 GPT 工具中,用于检测代码错误。未来,个人电脑或能利用设备知道的信息,如用户状态、偏好、日历和年龄,结合生成式 AI 查询,以获得更好的生成式 AI 体验,而「 这种体验远远优于云端 」。
而且,相比现在人们给各种聊天机器人交出个人信息的互动玩法,设备上运行的 AI 最大卖点还在于:隐私性,不必将私密上下文信息传递到云端进行处理。此外,还有即时性的好处,就是不必等待云端返回信息。
但在终端运行 AI 还有一个关键问题,模型推断需要大量计算怎么办?
据高通高管称,在云端训练大型语言模型时,通常使用 16 位或 32 位浮点数,导致每次模型推断都需要大量计算。相反,他们一直专注于压缩模型,进行量化和修剪,例如仅使用 4 位,节省功耗,并能在设备上执行更多并发 AI 处理,其称「 过去几个月大型语言模型的增长已经验证了,通过将模型量子化来使模型变得更小的策略 。」
此外,随着时间的推移,人们不断改进算法,模型开始变得更小。人们将采取的另一种方法是「领域特定模型」,即为特定应用程序训练模型,「模型可以变得非常小,并具有非常高的准确性。」
安蒙称:「基于高通多年的 AI 研发,包括在终端中性能卓越的 CPU、NPU 和 GPU 组合,以及我们对众多领先模型本地运行的支持,我们能够将生成式 AI 的优势带给全球用户,带给不同的终端品类。」
同时,为了让使用 Android、Windows 和其他操作系统的骁龙终端发现彼此,实现多终端无缝协作,高通在骁龙峰会上推出了跨平台技术 Snapdragon Seamless。
跨平台技术 Snapdragon Seamless |骁龙峰会
根据德勤网联消费者调查,每个美国家庭目前平均拥有 21 台数字化终端,但不同终端之间,尤其是不同制造商的终端之间信息传输通常并不顺畅。这将限制消费者的选择余地并导致锁定效应,即消费者为了实现其终端间的协同工作而不得不只从同一制造商处购买产品。
通过 Snapdragon Seamless,多个终端可以像只有「一个整体」那样运作,例如:鼠标和键盘可在 PC、手机和平板电脑上无缝使用;文件和窗口可在不同类型的终端间拖放;耳塞可根据音源的优先级进行智能切换;XR 可为智能手机提供扩展功能。
据悉,Snapdragon Seamless 未来将扩展至 XR、汽车和物联网平台。包括微软、Android、小米、华硕、荣耀、联想和 OPPO 在内的公司正与高通合作,采用 Snapdragon Seamless,该技术最早将于今年在全球范围发布的终端平台上落地。
从智能手机、增强现实设备、汽车到个人电脑,通过芯片,生成式 AI 对各种终端设备的渗透已经开始。而高通则是将「终端 AI」推向所有消费者的最重要的第一步,也是最重要一步的公司。
头图来源:高通