从小米 11 到骁龙 888,2021 年旗舰手机体验探究
来源:雷锋网
骁龙 888 带着 CPU、GPU 和 AI 性能的显著提升,和小米 11 一起拉开了小米新十年的序幕
"
作者 | 量衡
新 SoC 的发布节点,直接左右旗舰 手机 的发布周期。刚在 12 月发布的骁龙 888,不但打破了历史规律,还带着 CPU、GPU 和 AI 性能的显著提升,和小米 11 一起拉开了小米新十年的序幕。
小米 11 首批 35 万台之后,已多次连续放量,不少人已经体验到 2021 年的新旗舰。" 一人内测,全民公测 " 的酷安上,小米 11 的关键词已霸榜许久。
骁龙 888 注定会是 2021 年旗舰手机的标配,在它的身上可以观测到高通对未来的构想,也能预测未来一年移动端的趋势。
1
暴涨的 GPU 和单核性能
高通今年从台积电 7nm N7P 工艺切换到三星 5nm LPE 工艺。对比三星上一代的 7LPP,三星承诺同性能下的功耗降低 20%,同功耗下性能提高 10%,面积减少 20%。
构架方面,骁龙 888 更新到 Kryo 680,超大核是 2.84GHz Cortex-X1 构架,配备了 1MB 的 L2 缓存;大核是 3 个 2.24GHz 类 A78 核心,每核 L2 缓存翻倍到 512KB;而小核仍然是 4 颗 1.8GHz 的类 A55 构架。
Cortex-X1 是安卓阵营迎来的第一个公版超大核:6 条整数流水线,5 解码 8 发射的前端,有真 •PC 级的四条带 FMA 的 NEON,是移动端浮点堆料的极致。相应的,X1 的芯片面积是 A78 的 2.3 倍,峰值性能是 A77 的 1.3 倍,机器学习性能提升 2 倍。
和 X1 同代的御用搭档 A78,IPC 比 A77 提升 7%,主要负责 " 提升能效比、节省芯片面积 ",以达到更好的面积和功耗均衡。CPU 集群维持 4MB 的 L3 缓存,高通官方解释,这是难度和缓存配置之间的平衡。此外,骁龙 888 支持最高支持 4*16bit 3200MHz 的满血 LPDDR5 内存。
我们通过对比小米 11(骁龙 888)和小米 10 Ultra(骁龙 865),可以看到骁龙 888 在 GeekBench 和 RAR 的单核测试上,给出了安卓阵营多年没出现过的 25% 单核性能提升。高通更在乎持续输出,所以在频率设定上相对保守,多核提升在 11%-18% 之间。
在安卓阵营,单核性能一直没有得到应有的重视。但实际上,在当今的情况下,提升单核性能的效果和 " 性价比 " 都明显更高,会更加影响应用加载、切换、超大型 游戏 的体验。
对比需要深度优化的多核性能,单核性能的影响简单直接。在应对很多(其实是大部分)多线程优化不佳的日常 APP 和游戏时,单核性能的提升效果远高于多核性能。游戏中大量的游戏画面元素、移动、NPC 动作等,都需要 CPU 运算后再交给 GPU。而《原神》等跨平台的大型游戏的出现,让移动端的 CPU 压力空前绝后。
强大的单核性能,除了降低开发人员的压力,还无需额外优化就能直接提升大部分应用的基础使用体验。但在功耗敏感的移动端,无法像 PC 端那样提升频率,所以超大核的出现是必然的。
反映到这一代旗舰手机的基础体验,骁龙 888 单核 25% 的提升,即便是出厂 MIUI 12.0 系统,依然让小米 11 的系统操作出奇地流畅。监控频率可以看到发现,骁龙 888 的 X1 调度比较积极。
小米 11 在微博、贴吧、淘宝这些传统 " 巨型 "APP 的流畅度都上了一个台阶。应用开启、应用多开、切换等多种场景的感知,都出乎预料地明显。这时候再回来看,2.3 倍的芯片面积,仿佛又显得有 " 性价比 " 了。
GPU 方面,高通 Adreno 系列在安卓阵营独孤求败了很多年,在骁龙 888 上又带来了高通 GPU 史上最大的性能提升。840MHz 的 Adreno 660,性能提升 35%,能效比提升 20%,且性能和能效比的提升能同时实现。
同样使用小米 11(骁龙 888)和小米 10 Ultra(骁龙 865)对比参考,低压力场景的提升在 27% 到 35% 左右,提升最大的是 3D Mark 的 Wild Life 大压力测试,幅度达到 53%,Vulkan 模式下的 GFXBench Aztec 场景也有 43% 的提升。
而骁龙 865 的 Adreno 650,就算超频到 905MHz,GFX 曼哈顿场景也 " 只有 "110fps(默频骁龙 865 是 90fps)。但骁龙 888 的 Adreno 660,在 840MHz 就已经有 118fps,部分用户都跑到 125fps 以上了。骁龙 888 GPU 的同频性能,依然比超频到 905MHz Adreno 650 高 15% 以上。
性能之外,骁龙 888 还有隐藏技能。Adreno 660 是首个在移动端引入可变速率阴影(VRS)技术的 GPU。VRS 是桌面平台刚上的新增特性,能在 VR /XR 等场景中,降低非注视区域的着色精度,大大降低 GPU 的压力。在 VR/AR 还在构建发展的阶段,看到高通积极地提供相关特性,无论是游戏厂商还是用户,大家都是非常欢迎的。
2
第六代 AI 引擎:60% 的算力提升
和其他芯片厂商不同,在 CPU、GPU 和调制解调器之外,高通每年都会 " 花很多笔墨 " 聊 Hexagon DSP。而高通的 AI 构架,也是各个厂商中最特殊的。从 AI 部分的提升,能看到高通在方向和策略上的考量,以及未来一年移动 AI 的发展趋势。
遥想 2017 年,主流旗舰只有 0.6TFOPS 的 AI 算力,独立的 NPU 也才 2TFOPS 不到。但后来从骁龙 855 的 7TOPS,到骁龙 865 的 15TOPS,再到骁龙 888 的 26FTOPS,移动端对 AI 算力的渴求依然见不到尽头。
和常见的独立 NPU 不同,高通是 CPU+GPU+DSP 等多部件的异构 AI,宣称可以比独立的 DSP+ 机器学习推理引擎方案,提供更高的性能和灵活性。而当中的 Hexagon 780,其实是骁龙 888 上提升最大的部分。
以前 Hexagon 600 系列中的标量,张量(Hexagon Tensor Accelerator,HTA)和向量(Hexagon Vector eXtensions,HVX)功能,在 Hexagon 780 被融合在一起,成为一个整体式 IP。
融合后,不同执行引擎间的工作负载切换时间也更短,性能和能效都提升巨大,标量执行能力提高了 50%,张量执行吞吐量直接翻倍翻。SRAM 增加 16 倍后,狂涨的内存池,能运行更大的机器学习推理模型。
几乎推倒重构的构架,配合 X1 超大核 2 倍的机器学习性能和暴涨的浮点性能、AI 性能提升 43%的 Adreno 660,每瓦性能提升 3 倍的 Hexagon 780,让骁龙 888 可以提供远高于前代的 26 TOPS 算力。
骁龙 888 官方测试成绩
在机器学习基准测试 MLPerf 中,骁龙 888 的性能最高提升 4 倍,远超 IP 块在执行单元的理论计算吞吐量改进(新内存体系的优势?)
夸张的 AI 性能,有什么用呢?高通技术公司产品管理副总裁 Ziad Asghar 提到,AI 性能大幅提升的主要来自客户的需求。现在移动 AI 一大部分应用场景都是图像处理,是近年来手机拍照水平突飞猛进的重要原因之一。
虽然被吹得很玄学,但移动 AI 可笼统理解为 " 为各种 AI 算法设计的硬件加速器 "。而这些 AI 算法,早就应用到拍照(成像处理、拍照辅助、图像识别等)、语音通话降噪、语音识别、翻译、人脸解锁、手写识别、游戏和 XR 体验支持等大量领域。
高通的异构 AI 设定,是高通移动平台 " 关注均衡和功耗的设计思路 " 的产物。在骁龙 865 首次集成的传感器中枢,也已经升级到第二代,并集成性能提升 5 倍,但功耗不到 1 毫安的专用低功耗 AI 处理器。后者可以提供低功耗的全天候 AI 待命能力,并分担 Hexagon 780 80% 的工作负载。
其在 "Ok,Google" 侦测算法上,可以降低 38% 的负载,并为陀螺仪、麦克风等需要全天候实时收集数据的传感器,提供更多的可能性(已被用在汽笛声、婴儿哭声的低功耗监测等场景上)。
3
计算摄影:AI+ 拍照
AI 是 " 计算摄影 " 的基础,小米 11 发布会重点说的夜景视频拍摄和众多拍照提升,背后是骁龙 888 全新的三 ISP 和 Hexagon 780。
在小米 11 上,除了骁龙 865 时代就有的 AI 换天功能,现在夜景模式也能用来拍摄视频,大幅提升夜景视频的画面亮度和降噪表现。夜景视频可理解为每秒拍摄超过 24 张超级夜景照片,是 ISP 和 AI 算力暴力提升的直接效果。
在拍照过程中,AI 也负责提供非常基础的 HDR+ 硬件加速能力,能进行画面降噪、重新着色、自动校色(让色彩表现更加真实或更加吸引眼球)等操作。像把单摄玩出花的 Google,就已经依靠 AI,提供了背景虚化、全景、Motion 动图(类似 iOS 平台的 Live Photo)、AR 实时追踪贴图、超分辨率放大、超级夜景等多种功能。
骁龙 888 融合 AI 3A 算法的快速对焦
虹软 " 傻瓜相机 "
除了效果提升,也有很多是关于拍照易用性和趣味性的提升。例如骁龙 888 融合 AI 的 3A 算法,能提高对焦速度。虹软基于 Spectra 580 和第六代高通 AI 引擎推出 " 傻瓜相机 " 功能,可以自动跟踪人物,自动进行画面缩放变焦等。
4K 30FPS 的实时背景抠图
在高通 AI Engine 的支持下,骁龙 888 可以做到 4K 30FPS 的实时背景抠图,CV-ISP 硬件计算视觉加速器也能提供 60fps 实时景深识别的人像、背景分割和替换,人体追踪、物体识别 / 追踪的效果。
一亿像素样张,细节放大对比
夜景样张,细节放大对比
而相同 CMOS、同样是 MIUI 的小米 11 和小米 10 Pro,是非常适合用来对比 ISP 和 AI 对拍照影响的样本。得益于骁龙 888 的 ISP 和 AI 性能,小米 11,不论取景框预览画面、1 亿像素模式、HDR、夜景等多帧合成场景,画面的高光压制、鬼影、伪像、颜色还原等部分,都有明显提升。
4
总结:安卓阵营大跨越的一年
这是小米多年来,首次在 1 年内发布两台数字系列旗舰,骁龙 888 机型的量产时间远比以前早,为下一代产品留下了充足的准备时间,不禁让人猜想,高通是不是在憋着什么大招。
高通做的是 SoC 移动平台,在他们眼中,除了绝对性能,均衡也是核心指标。骁龙 888 在 CPU 单核性能和 GPU 性能上的提升,直接抬升了安卓旗舰日常操作的流畅度,以及应对跨平台大型游戏的能力。而 AI 和 DSP 的倍数级提升、传感器中枢上的低功耗 AI 处理器,则成了高通新的护城河。