英特尔十代酷睿将带来体验更好、更全面的设备
在中国人的观念里,“10”这个数字象征着完美,十全十美是对于人或事物的最高评价。
10,对于英特尔来说同样重要。10nm关系着英特尔在半导体芯片行业未来能否更进一步,10代酷睿也关系到英特尔能否正面迎接来自竞争对手、来自舆论的压力。而将10nm与10代酷睿联系在一起,能够做到十全十美呢?
接下来,让我们通过对英特尔10nm IceLake 10代酷睿处理器技术细节解析,来找找答案。
英特尔酷睿架构回顾
在10nm制程之前,英特尔严格遵循摩尔定律以及Tick-Tock战略,通过制程工艺与架构技术迭代来稳步推进PC半导体制程技术与性能的发展。65nm到45nm用时2年,45nm到32nm用时3年,32nm到22nm用时2年,22nm到14nm同样用时2年,然而在14nm到10nm推进过程中,英特尔却经历了更久的时间——4年。
随着制程工艺不断演进,相关技术迭代速度也逐渐放缓。光刻机技术、晶体管技术、新材料等诸多领域的研发速度放缓,加之英特尔对10nm制程额外看重,希望通过10nm技术积累为10nm到7nm制程演进做铺垫,因此耗费了更久的时间。
10nm IceLake晶圆
不过,时间终究是推动历史前行的车轮,英特尔10nm制程工艺,以及英特尔第10代酷睿处理器,即将与我们见面!
一、10nm IceLake制程架构特性解析
首先我们需要弄清楚两个问题:
其一,英特尔10nm制程工艺代号为IceLake,但架构名称不再用IceLake来统一命名,其架构名称为Sunny Cove。
其二,英特尔10nm IceLake处理器正式落地之后,没有意外的话,首批将全部是移动级处理器,也就是U系列或Y系列处理器,暂时没有桌面级处理器,这也意味着英特尔第九代酷睿没有U/Y系列低电压处理器,同时新的桌面级处理器很可能依旧是14nm制程,此前曝光代号为Comet Lake。
接下来我们看看10nm制程架构的详细特性:
首先来看IceLake平台。全新的10nm IceLake平台在性能表现上借助了AI功能,支持DL Boost、支持Dynamic Tuning机器学习,它能够动态地分配GPU与CPU的负载与功耗,虽然并非10nm平台新技术,但对于IceLake处理器的性能表现有明显的帮助。
此外,10nm IceLake平台全面支持雷电3接口、Wi-Fi 6无线通信模块、4K 60FPS HDR视频播放、更快的、更高质量的HEVC编码,并借助全新的GEN 11核显,支持1080分辨率电竞 游戏 的流畅运行。
IceLake平台特性
在新特性方面,10nm IceLake平台具备以下几点:
一,全新的Sunny Cove微架构;
TIPS:以下是关于Sunny Cove微架构技术特性的分析
Sunny Cove微架构主要聚焦在ST单核性能、全新ISA及并行性三个方面的优化和改进,Sunny Cove微架构主要解决以下四个问题:
其一、增强的微架构,可并行执行更多操作。
其二、可降低延迟的新算法。
其三、增加关键缓冲区和缓存的大小,可优化以数据为中心的工作负载。
其四、针对特定用例和算法的架构扩展。例如,提升加密性能的新指令,如矢量AES和SHA-NI,以及压缩/解压缩等其它关键用例。
对于处理器来说,IPC强弱与CPU性能有直接关系。英特尔在Sunny Cove微架构IPC性能提升方式上给出了三个字:更深(deeper)、更宽(wider)、更智能(smarter)。
更深方面,Sunny Cove微架构表现在L1容量的增加,从32KB增加到48KB,而且L2缓存、uop、TLB缓存都更大;
更宽主要体现在执行管线上,Sunny Cove微架构分配单元从4个增加到5个,执行接口从8个增加到10个,L1 Store带宽翻倍。
而想要让更深、更宽发挥出应用的实力,那么就需要有更好的算法。Sunny Cove的smarte就是为此而设计。英特尔研究院院长宋继强在解答这个问题时主要提及两个方面,其一是提高分支预测精度,其二是减少延迟。另外英特尔还为Sunny Cove微架构配置了加密解密指令集,并在AI、存储、网络、矢量等方面进行全方位改进。因此对于PC用户来说,无论是消费级还是服务器用户,Sunny Cove微架构带来的变化要比10nm这个制程节点数据更有意义。
Sunny Cove微架构示意图
二,高带宽、低延迟特性;
三,全新的内存控制器,支持LP4/x-3733和DDR4-3200高速内存;
四,搭载性能更强,最高拥有64EU、1TFLOP运算能力的GEN 11核芯显卡;
五,支持10bit 4K 60FPS、10bit 8K 30FPS视频编码;
六,支持5K 60FPS或4K 120FPS、DP 1.4以及BT.2020色域
七,高达16MP图像处理器单元。
从新特性来看,10nm IceLake平台的主要升级点除了新架构之外,最重要的是提升了图形、显示部分的性能表现。
10nm制程工艺新特性及芯片架构示意
10nm IceLake将PCH封装到一个芯片上,而PCH芯片则由14nm制程工艺打造。集成Wi-Fi 6 GIG+和新的电源管理,整合802.11ax,并能够更好的控制CPU和PCH的能耗和功耗。
PCH采用14nm工艺打造
此外,Audio DSP是英特尔第8代酷睿时候就具备的功能,它的主要作用是支持低功耗下的语音唤醒。而相对于8代酷睿来说,英特尔对10代酷睿的Audio DSP做了进一步优化,在功耗表现更好。另外在I/O接口方面没有新的变化。
二、10代酷睿处理器封装规格与基本参数
了解了制程架构相关信息之后,我们来看看英特尔10代酷睿的相关规格。
首先来看处理器封装规格。英特尔10代酷睿针对9W和15W功耗处理器进行了不同规格的封装,9W处理器芯片规格为26.5×18.5×1.0mm,针脚间距0.43mm;15W芯片规格为50×25×1.3mm,针脚间距0.65mm。二者均采用BGA封装,插槽规格分别为1526和1377。
处理器封装规格
两种尺寸的10代酷睿芯片
英特尔10代酷睿首批产品拥有酷睿i3、酷睿i5以及酷睿i7三个型号,没有酷睿i9。TDP主要为9W、15W、28W,采用4核8线程,缓存为8MB,最高频率4.1GHz。
其中,英特尔酷睿i3全部、以及酷睿i5绝大部分处理器显卡为UHD核显,酷睿i5极少数型号以及酷睿i7最高支持英特尔Iris Plus核显,且最高支持64EU锐炬核显。
此外前面也提到了,10代酷睿支持LP4/x-3733以及DDR4-3200规格高速内存条。
英特尔10代酷睿基本参数
TIPS:关于基本参数的分析
从基本参数来看,英特尔10代酷睿在核心数上与第8代酷睿相比没有变化,TDP基本保持一致。9W主要放在Y系列上,相对8代酷睿的Amber Lake Y系列7W TDP来说,略有提升;15W主要放在U系列处理器上,与8代酷睿相比保持不变。
不过细心的朋友可能发现了,英特尔10代酷睿频率有所下降,Max Turbo最高到4.1GHz,这可能会导致英特尔10代酷睿在跑分上与8代酷睿相比提升较少。
另外,之所以降低频率,主要原因是一部分TDP分配给了GEN 11核显,为了平衡功耗,降低主频是必须去做的妥协。
三、GEN 11核显规格分析
GEN 11核显是英特尔10代酷睿非常重要的一个新要素。在年初的CES上,英特尔透露了GEN 11核显的基本信息。在架构层面,英特尔GEN 11核显最高集成64个执行单元(EU),而第9代核显只有24个。它们分为四个区块(slice),各有两个 媒体 取样器、一个PixelFE、载入/存储单元,每个区块又细分为两个子区块(sub-slice),都有自己的指令缓存、3D取样器。
GEN 11核显架构渲染图
英特尔对EU内的FPU浮点单元进行了重新设计,不过FP16单精度浮点性能没有变化,同时每个EU继续支持七个线程,共512个并发流水线,同时重新设计了内存界面,三级缓存增大至3MB。
Iris Plus最大能达到64EU
另外GEN 11核显支持Adaptive Sync(适应性同步)技术,相对于NVIDIA G-Sync来说成本更低。
伴随GEN 11核显而来的,还有全新的显卡控制界面。该界面除了针对显卡的各项调试功能之外,还支持超过40款游戏的入库和快捷启动。同时我认为,全新的显卡界面也是在为英特尔Xe独显做准备。
全新的显卡控制面板
Command Center细节
TIPS:关于GEN 11核显更多信息
其实除了最大的64EU规格,再向下也有32EU规格核显,主要放在酷睿i3和低端的酷睿i5处理器上。
Iris Plus也是10代酷睿的一大亮点,64EU主要放在酷睿i7处理器上。另外,高端的酷睿i5处理器和酷睿i7处理器也会搭载Iris核显。
此外,显卡主频提升到了1.1GHz
四、10nm IceLake创新生态解读
与以往新制程平台单纯聚焦处理器芯片不同,英特尔10nm IceLake更强调整个创新生态。因此在10nm IceLake处理器、GEN 11核显之外,Wi-Fi 6 GIG+、Optane H10混合固态盘、Thunderbolt 3扩展以及AI层面的性能、功耗辅助等,应该与处理器放在一起去看,这才是一个完整的10nm IceLake。
首先来说Thunderbolt 3。
3月初,英特尔宣布向USB Promoter Group开放Thunderbolt协议规范,从这一刻开始,无论是PC设备、平板设备,还是任何形式的外接扩展设备,都可以免版税的形式构建兼容Thunderbolt标准的芯片。与此同时,USB Promoter Group宣称将发布基于Thunderbolt协议的USB 4规范。
这意味着,在该标准协议框架下,USB 4物理连接器将与Thunderbolt 3和TYPE-C相同,带宽方面得到提升,达到40Gbps,这与Thunderbolt 3接口一致,也就是说,USB 4规范将兼容Thunderbolt 3。
雷电3接口功能强大
Thunderbolt 3是目前最强的物理接口,双向带宽达到40Gbps,是现有速度最快的USB TYPE-C 3.1 Gen 2接口的四倍,且雷电3接口支持4K 60fps视频传输,支持100W PD协议供电,支持外接桌面级显卡,因此可以说是目前最为强大的接口扩展标准。
现有的雷电平台架构
全新的雷电平台架构,主要优化了CPU和PCH通路,使其具备更高的效率
在10nm IceLake平台上,英特尔对Thunderbolt 3架构做了新的优化,对比上面两张架构图,其实大家可以很明显的看出以往和现在雷电平台架构的差异。主要就是优化了CPU、PCH到接口物理层的结构,使得数据传输效率更高,延迟更低。
同时,英特尔在10nm IceLake平台上直接植入ThunderBolt 3,包括入门级的酷睿i3平台。
Wi-Fi 6 GIG+也是英特尔10nm IceLake的重要组成部分。
目前,Wi-Fi 5为802.11AC标准,QAM最高为256;Wi-Fi 6为802.11AX标准,QAM最高为1024。拥有更快的响应速度、更强的稳定性和更快的速度。延迟降低75%、覆盖范围提升4倍,支持更多设备的稳定连接。
性能方面,160MHz频宽Wi-Fi 6 GIG+最高可以做到1.68G传输速度,相对于80MHz频宽标准的2×2 Wi-Fi 6有3倍的速度优势。同时相对于80MHz频宽标准2×2 AC而言,速度提升40%。
标
准2×2 AC与AX速率对比
英特尔Wi-Fi 6无线网卡拥有两种规格,采用了全新的设计,如下:
两种规格的Wi-Fi 6模块
左侧是基于14nm制程打造2230规格无线网卡,右侧是基于28nm制程打造的1216规格网卡。
总体来说,英特尔Wi-Fi 6具有以下两大明显优势:
其一,支持多设备连接,更稳定;
其二,对延时有更好的管理和控制。
年初CES,英特尔公布了全新的傲腾H10混合固态盘,相对于以往的Optane Memory来说,傲腾H10混合固态盘主要在于把Optane Memory与英特尔QLC固态硬盘整合在了一起。因此将Optane Memory的非易失性存储特性以及低延迟、快速响应、性能一致性等特点。与英特尔QLC 3D NAND技术的高单元密度、低成本特性,很好的结合在了一起。
傲腾混合式固态盘特性
作为10nm IceLake生态上的重要一环,英特尔傲腾H10混合式固态盘,可将文档打开速度提高2倍;多任务处理状态下,游戏启动速度提高60%;媒体文件打开速度提高90%。相对于普通NAND固态硬盘而言,傲腾混合式固态盘拥有更快的速度、更好的性能。与独立的TLC 3D NAND固态盘系统相比,英特尔傲腾混合式固态盘不仅能够更快地访问常用应用和文件,还能加速后台活动的响应。
傲腾H10混合固态盘拥有三种规格:16GB(英特尔傲腾内存)+256GB(存储)、32GB(英特尔傲腾内存)+512GB(存储)、32GB(英特尔傲腾内存)+1TB存储。
五、10nm IceLake性能标准
目前,英特尔10nm IceLake只是处在发布状态,产品还未正式落地,不过10nm整体进程的推进速度应该有所加快。所以在性能层面,目前我们只能通过英特尔的官方数据来窥知一二。
英特尔在发布10nm IceLake处理器与GEN 11核显的同时,特意强调了1080P电竞游戏的流畅运行。通过下面图标可见,搭载Intel Iris Plus核显的10代酷睿处理器能够在相应的画质模式下,较为流畅的运行一些常见的电竞游戏,如CS:GO、彩虹六号、坦克世界、堡垒之夜等,相对于现阶段8代酷睿的UHD 620核显来说,图形性能提升还是比较大的。
1080P电竞游戏运行帧数
在处理器性能上,英特尔目前只给出了15W单线程的表现,从下图可见,10代酷睿性能提升接近1.5倍,大概为1.48倍左右。如果以相邻代数性能提升倍数做参考的话,性能提升幅度不算很大。
15W单线程性能
IPC是处理器性能的重要指标。Sunny Cove微架构为10代酷睿带来了18%的IPC性能提升,相对于SkyLake微架构有1.4倍的提升。另外这里需要说明的是,英特尔给出的IPC提升18%数据是通过5个Benchmark测试出来的结果,18%是一个平均下来的水平线。
另外,结合单线程1.48倍性能以及之前提到的主频来看,其实可以看出英特尔10代酷睿为了保证GEN 11核显的性能,因此将CPU与GPU之间的功耗分配做了一定的平衡。
IPC提升18%
此外,10代酷睿在引入AI加速之后,能够更好的动态控制能耗和功耗,智能化的挑选最优核去做高负载任务,给处理器核心效率(注意是核心效率)带来不小的提升。
英特尔AI加速有三个层面:一是CPU通过深度学习降低延时;二是也可以用GPU来进行智能的应用加速;三是拥有更好的性能表现。
TIPS:关于英特尔AI加速功能的说明
英特尔AI加速功能主要是通过AI技术,分析并判断出哪些核心处于最优状态,在高负载任务时会优先选择这些核心来承担负载。
而以往英特尔加速功能是随机选择核心来承担负载,这些核心可能并未处在最优状态,所以有可能造成效率的滞后。
DL Boost AI加速
六、结语
英特尔10nm制程工艺可谓是“千呼万唤始出来”,而英特尔第10代酷睿又是第一代10nm制程落地的产品,所以其重要性不言而喻。无论是关注这个领域的普通消费者,还是行业内的合作伙伴,亦或是竞争对手都在盯着英特尔10代酷睿,其最终表现究竟如何,还是需要产品上市之后再做检验。
英特尔10代酷睿
不过,英特尔通过10代酷睿给业界带来了一个新的信号,即生态化、平台级的创新或将主导未来PC产业的方向。
伴随10代酷睿处理器,英特尔还带来了新的无线网络技术、新的存储技术、新的AI技术、更强大的图形技术以及最先进的接口技术,这些技术将为基于10代酷睿平台打造的PC产品带来全方位的体验,而不仅仅是局限在处理器一个部件上的比拼。
其实对于占比极大的普通消费者来说,处理器计算能力已经足够满足90%以上的应用需求。相反,存储瓶颈、接口瓶颈、网络瓶颈却在影响着我们的体验、制约着效率的提升,Wi-Fi 6、Thunderbolt 3、Optane H10正式解放这些瓶颈的关键所在,相比一味提升处理器性能,全方位的提升才能带给