你们都得退休!ARM Cortex-A35构架分析
今天凌晨ARM在自家的技术大会中,发布了超低功耗的处理器构架Cortex-A35(代号水星)。厂商可以根据性能和功耗需求,对它的构架进行再设计,将其用在不同的领域。
Cortex-A系列分为高性能、低功耗和超低功耗3类:
-
高性能系列的代表当然是ARM的大核构架Cortex A57和A72(还有在慢慢退市的A15和A17);
-
低功耗系列的代表是高效能比的A53,根据需求,它可以以多核,或者 big.LITTLE大小核的形式工作;
-
而超低功耗系列,在A5和A7之后,现在新增了A35。
虽然看起来有点反直觉,但A35和A53不是一个系列,A35是A7/A5的继任者(ARM的产品数字增长得真快……)。
在Exynos 5433测试中,我们发现作为升级版A7的A53,照样维持不了A7的功耗水平,它更像是把A7的效能曲线延长的产品,就是说A53的性能功耗比并没有多少提升。但因为A53普遍更高频,所以它在性能端可以走得更远。而A35这次主推能耗比,其实是在给当年吹过能耗比的A53打脸。
不过从战略意义上说,A35带来的最重要改变,是让Cortex-A系列上中下三路产品,都用上了64位的ARMv8构架。在A5/A7等老构架退休后,它就可以完成“全家64位”的宏愿了。此外,A35也可以和A72/A57/A53等核心组成big.LITTLE 大小核结构的SoC,可以让厂商根据需求,搞出各种大小核的组合产品,夸张一点,甚至可以搞出A35+A53+A72的三核心簇的SoC。
构架改进
A35和A7/A53一样,依旧是顺序执行的双发射构架。8级流水线长度,也和之前的构架设计没什么分别。ARM主要通过改进独立分区(individual blocks)来提升能效比。
-
重点改善的是核心的前端效率,重新设计的指令预取单元,更强的分支预测性能。为了平衡性能和功耗,指令预取带宽也跟随队列长度的变短而做出了调整。
-
对比A7,A35在缓存速度上有了明显的提升。A35套用了很多A53的缓存结构,一级缓存可以用作指令和数据缓存,加入了多线程的数据预测和写入侦查能力,根据需求可以定在8-64KB之间。二级缓存可以定在128KB-1BM之间。在提升写入效率,引入附着优化功能以降低占用的同时,也提升了资源共享的性能。
-
另外一个大改进是 NEON/FP流水线,除了改善存储性能外,新的单元全流水线支持双精度乘法计算。流水线同样为了提升局部效率而进行了改进,这也是A35芯片面积可以比A53小的重要原因。
-
在电源管理方面,A35也很像A53,它为CPU和NEON流水线(独立的电源供应区域)增加了状态保留功能(retention,在休眠,让核心保持原来的状态,类似iOS的墓碑模式),它多了个硬件来控制CPU进出保留状态。厂商很少使用这个功能,暂时确认有引入这个功能的是骁龙810,但或许因为发热问题,它也在随后的软件更新中禁用了这个功能,让在CPU闲置的时候直接关闭核心了。
低功耗/可定制化/超小芯片面积
A35盯准的功耗区间是125mW以下,这也是A7和A5通常的功耗范围。为了方便我们脑补,ARM表示,用28nm制程的1GHz主频A35处理器,其功耗只有90mW。当然,就像现在不同SoC里的A53,因为核心数、主频和工艺节点不同,A35核心的功耗也会很大的波动(例如用14/16nm制程,或者把主频推上2GHz)。
而A35也是ARM可定制化最高的构架,厂商能选择的不再只有核心数,他们可以选择是否加入NEON, Crypto(加密)和ACP(解析) 单元,甚至是否加入二级缓存都可以自行选择。这让A35可能成为下一代手机中应用最广的核心构架,我们也很可能会在 可穿戴设备 和嵌入式平台上,看到一大堆为IoT( 物联网 )定制的A35处理器。
对比32KB一级缓存,1MB 二级缓存,有NEON/Crypto加密模块的4核A53,剔除其他部分的乞丐版单核A35(8KB一级缓存,没有二级缓存),即使用28nm制程也能把芯片面积控制在0.4平方毫米一下(1*0.4mm,这可比米粒要小多了),这让它非常适合做成物联网芯片。
性能提升
在相同的核心数和频率下,A35构架宣称功耗比A7低10%,而且性能要高6-40%。在整数运算(SPECint2006测试)中,可以提升6% ;浮点运算(SPECfp2000测试)中提升更大,可达36%。
根据需求,A35可以做到A53 80-100%性能。在浏览器负载测试中,A35和A53的差距最大,A35最多只能提供A53 80%的性能;整数运算负载测试中,A35可以达到A53 84-85%的性能;而对于提升最大的缓存性能,反映在需要缓存性能的负载测试中,则可以有接近A53的性能表现。
A35的芯片面积只有A53的75%,而功耗则只有A53的68%。ARM宣称他们可以同时使用,甚至和A53做成大小核构架的SoC。
A35只要把频率提升,就能补上和A53的性能差距。即使再最差的方案中,高频A35会吃掉自己在功耗上的优势,但厂商依旧可以换来更小的芯片面积,照样可以省下一大笔费用。
如果正如PPT所说,无论是单独组成多核SoC,还是和A72等大核组成大小核结构的场合,都已经没什么必要使用A53构架了,A35很可能会代替A53。
ARM预计首批A35设备会在2016年末出货,因为用途和适应性奇广,它毫无疑问会成为之后数年里,ARM系列中最重要的的核心构架之一。
这么一想,A35在接下A5/A7的工作之后,顺便也让A53领便当了……
不过作为跑分党,笔者更关心高性能核心A72的表现,毕竟要同时抗衡苹果的A9、高通的Kryo和三星的猫鼬,一不小心就得领便当了。
via: anandtech