Exynos 8890 和 骁龙820 相继发布,Kirin 950 差在哪?

爱范儿  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
标签: Exynos 8890 三星 华为 骁龙 820 高通 麒麟 950

平心而论,Exynos 8890 和 骁龙 820 面前,Kirin 950 目前还只是陪衬。

首先是 GPU 部分的差距

使用了Adreno 530的骁龙 820 暂且不说,麒麟 950 整合了 Mail 图形芯片最新一代的高端型号 Mail-T880( Mail-T880 允许从一到十六颗核心的堆叠),但是却是 MP4 规格。相比 Exynos 8890 的 T880MP12,后者力理论上图形处理能力是前者的三倍。即使对比上一代 Exynos 7420,也用上了 MP8 规格(Mail-T760 核心)。

所以,麒麟 950 在 GFX Bench-3 测得的真实性能如下图:

麒麟950-1

麒麟950-2

Kirin 950 的图形性能有一个比较接近的参照对手,是今年 5 月份联发科发布的 Helio X20,同样采用 Mail-T880MP4 。联发科共同运营组长朱尚祖对媒体宣称,“ 麒麟 950 不过是 Helio X20 的水准”,大致没错。

当然,令人欣慰的是,Kirin 950 采用了台积电 16 nm FinFet+ ,也就是今年 iPhone 6s 第三方测试成绩略优于三星 14nm 的工艺。麒麟 950 整合的 Mail-T880MP4 图形核心数量虽然少,但频率提升到 900 MHz,竞争对手却是多核心+低频的方式。如此做法,麒麟 950 的思路跟联发科相似:

在大部分真实的日常应用案例里,图形芯片并不是性能瓶颈,发挥图形芯片所有核心的的潜能,也几乎不存在这种情况。所以,集成更少的图形核心减少芯片面积,将节省的晶体管资源运用在其它部分,麒麟 950才有了整体的显著提升。

麒麟950 -3

至于三星 Exynos 在 GPU 部分暴力堆料,十二颗核心的 Mail-T880MP12 据说是为了 “沉浸式的 3D 游戏和虚拟现实应用体验做准备”。

其次是应用处理器部分

麒麟 950 采用了 ARM 公版设计,真实应用效率有待检验。

移动芯片,主流芯片厂商像 MTK、三星、华为会采用 ARM 官方标准微架构 “Cortex-A” ,即 ARM 公版设计。尽管 ARM 的公版设计经过了 ARM 相关测试,厂商可以节约开发和时间成本加速产品上市,但其带来的负面影响也显而易见,就是芯片的同质化,并最终反映到智能手机的体验上。而像高通和苹果,拿到 ARM 授权但使用自主设计微架构大核心,芯片效率和整体性能处于较明显的领先地位。

三星前不久发布的 Exynos 8890 首次使用自主设计的 “Exynos M1” 核心,已经曝光的测试数据显示,其单核心提升明显,三星也对外宣称 Exynos 8890 整体性能相比上一代 Exynos 7420 性能提升 30%,功耗则下降  10%。

 A53 和 A57 混着用,组成所谓的 “big.little” 大小核结构,简单任务时 A57 核心休眠只启用 A53 核心,复杂任务时 A53、A57  一起上,不幸的是,A53 和 A57 的指令吞吐和缓存是互相独立的,如果某个应用需要在 A53 和 A57 之间切换运行,A53 和 A57 核心之间切换延迟最多可达毫秒级,别看是毫秒级,反映智能手机上最直接的体现要么就是应用的卡顿,要么就是功耗过高,惟一折中的方法就是利用制程来缓解。这也是为何同是使用 ARM 公版设计,采用 14 纳米FinFET 制程的三星 Exynos 7420 整体表现(能耗比)优于同样使用 ARM 公版设计,但采用 20 纳米制程高通 810 的主要原因,而高通 810 备受诟病的所谓“发热”背后则是 ARM 公版设计和制程落后两方面因素叠加的结果,反映到市场竞争中,则是高通痛失三星 Galaxy S6 旗舰机芯片订单。

更重要的,拥有芯片架构自主创新能力,也意味着能够以更大的自由度去优化特定应用程序的性能或者功耗表现。像 A53 和 A7 运行功耗对比:

麒麟 950 -6

这是与竞争对手拉开差距的关键。

如果说苹果是采用自主芯片架构在智能手机竞争中受益的典型代表,那么今年高通 810 的悲剧则是反面典型。高通之前一直采用自主设计的微架构,但因为去年苹果率先推出 64 位 CPU 打乱了原有的研发计划,今年直接拿公版架构过渡、匆忙推出了旗舰骁龙 810,再加上使用了较落后的芯片制程工艺,功耗和发热失控,几乎导致整个 Android 阵营经历了“失去的一年”。

最后,没有整合最新的基带,以及缓存架构的落后

三星 Exynos 8890 和 高通骁龙 820 整合的基带都支持 Cat. 12(下载速度达到 600 Mbps)和 Cat. 13(上传速度达到 150Mbps),通信设备出身的华为居然还停留在仅支持 Cat .6 的老款 Balong,与早前的麒麟920/925、930/935 属同样规格。其实华为有新一代 Balong 基带可以达到支持 Cat .12 和 Cat .13 水准,为什么没有用在最新一代处理器上?

另外不得不提的是,big.LITTLE 大小核心双架构已经逐渐普及开来,从三星 Exynos 5410 到高通骁龙 810 莫不如此,而它们之所以能做到不同架构核心共存、协同,最关键的地方就是缓存一致性互连架构 CCI-400。

ARM 在今年早些时候宣布新的高端 CPU Cortex-A72、GPU Mali-T880 的同时,还推出了大刀阔斧改造过的新一代缓存一致性互连架构 “CoreLink CCI-500”,引入了一系列新功能。

在很大程度上,它的诞生要远比 A72、Mail-T880有意义得多。

CCI-500 最大的变化就是增加了一个“探听过滤器” (Snoop Filter),从而使探听控制不再局限于单个簇内部的 CPU 之间,可以扩展到整个处理器的所有核心,也就是 A72/A57、A53 全部覆盖。 这样一来,处理器需要执行的缓存查询工作量就会大大减少,效率自然随之增加,最终的好处就是互连过载降低、CPU 核心空闲时间更多。互连所需的内存带宽也会因此大幅度减少,ARM 宣称 CPU 一端的内存性能可提升 30%。ACE ( AXI 一致性扩展)端口的数量也翻了一番,系统带宽因此增加一倍,可轻松搞定 4K 显示输出。 四通道 128-bit 内存位宽也不再是问题。骁龙 805 是第一个支持四通道内存的移动处理器,但用的是高通自己设计的非一致性互连架构。以后,谁想做都可以。

按 AnandTech 的 原话 来说,采用了 A72、Mail-T880 GPU、big.LITTLE 架构的麒麟 950,本应该也同时用上最新的 CCI-500 架构数据总线,因为它们三者都是今年 2 月份一起发布的。但不幸的是,CCI-500 发布的时候,已经不在麒麟 950 开发过程中(这意味着下一代麒麟很快发布,950 只是过渡?)。所以麒麟 950还是停留在目前 big.LITTEL 结构 SoC 都使用的 CCI-400。

当然,华为麒麟 950 也有竞争对手羡慕的特性

像独立设计的 ISP 和 DSP、i5协处理器、首个同时支持 LPDD3/LPDDR4 混合内存。这些并未让太多人关注的“边缘部分”,在拍照效果、影音播放、多种传感器调度省电等日常使用上有重要增益。

麒麟950 -7

麒麟950 -8

适度追求指标技术领先,更加关注 SoC 的真实体验,华为的设计思路和迭代方向,在一众 Android 厂商中是非常难得的。如果后续实现自主设计微架构,图形芯片“堆料”,再加上现在已能用上台积电最先进的制程工艺,像苹果一样深耕影响真实用户体验的硬件技术…

华为下一代差异化处理器,将真正震惊世界。

 

题图来自:Google 插图来自: AnandTech  和 高通吧

随意打赏

提交建议
微信扫一扫,分享给好友吧。