14nm制程的首秀 Radeon RX 480首发测试
2016年6月1日,AMD于台北电脑展的第二天正式发布了自家采用14nm制程的新显卡——Radeon RX 480,该卡的正式发布标志着AMD也迈进了1x nm时代,同时也正式宣告AMD与NVIDIA新一轮的显卡大战正式开始。虽然AMD和NVIDIA的新卡同属1x nm制程,但目前两家还未形成正面交锋之势,NVIDIA首发的16nm新卡定位是高端旗舰,而AMD的新卡则主攻相对主流的中高端市场,定位的不同决定了把GTX 1080/1070拎出来同RX 480相比没有任何意义。当然,如果非要一战的话,也不是不可能,就看怎么比了......
时间回到6月1日的Computex,准确的说是5月28日的AMD Polaris Tech Day,AMD的全球资深副总裁兼首席架构师Raja Koduri宣称RX 480 CrossFire的性能要超过GTX 1080单卡,之所以这么说,是因为在全球首个DX12游戏《奇点灰烬》中,RX 480的双卡交火平均帧数要高出GTX 1080 3帧左右。用单卡跟双卡比有什么意义?很简单,重点就在于成本上。AMD的意思很明显,RX 480双卡交火性能要超过GTX 1080,但成本却少很多,GTX 1080 Founders Edition的售价为699美元,而RX 480双卡加起来的售价也不过500美元,200美元的价格差,足够再添置一颗性能不错的CPU了,这,正是AMD想告诉我们的。
AMD的全球资深副总裁兼首席架构师Raja Koduri展示Radeon RX 480
说到这里就不得不说一下RX 480的售价:RX 480的售价为249美元,对应的国内售价为1999元人民币。通过价格可以看出,该卡比去年年末发布的R9 380X要贵一些,但要低于R9 390 4G版,因此可以看出RX 480的定位就是R9 380/380X的继任者,主打甜品级市场。那么对应区间的N卡是什么呢?有意思的是N卡没有可以与之对位的显卡,因为这个价格区间本应该用一块“GTX 960Ti”去填补,可NV并没有推出“GTX 960Ti”的意思,因此这块市场是被R9 380X独占的。
AMD Radeon RX 480
如此看来,AMD推出的RX 480似乎有意避开了与N卡的正面对决,当然,这也跟NVIDIA在GTX 960和GTX 970之间的价格性能差过大有关。不过随着NVIDIA新一代Pascal架构显卡的发布,其MAXWELL 2架构的GTX 900系列显卡都迎来了一个大幅降价,欧美那边GTX 970、980以及980Ti均降价约20%,虽然国内这边还没有什么动静,但想必降价大潮也快来了。目前京东非公版GTX 970的售价为2500元左右,打个八折差不多就是RX 480的价格, 因此我们可以将RX 480的对手锁定为GTX 970 。
RX 480 8G版的售价为1999元
以AMD一贯的风格,同售价一定会在性能上领先一些(Fury和Nano这种造价高的卡除外),而根据近阶段外媒的各种跑分爆料来看,RX 480似乎有着和GTX 980差不多相同的性能,事实真是如此么?有一点我们是需要清楚的: AMD官方从未在任何场合宣布RX 480的单卡性能,仅仅强调双卡性能要高于GTX 1080。 这有点不像AMD的风格,就拿之前的R9 380X为例,AMD明确宣称其强于GTX 960 OC版,这次却并未强调单卡性能,不得不让我们怀疑,这个神神秘秘的RX 480到底有着怎样的实力?
讯景的RX 480带有背板
抱着这样的疑问,我们开始了Radeon RX 480的首发测试,我们共收到三块RX 480,其中两块是公版,一块是“讯景的公版”。公版RX 480无需我赘言,大家通过之前的发布会以及京东的预售活动已经算有所了解了,我在这里重点要说的是这块讯景的公版RX 480,这块卡整体外观同标准公版无异,但讯景特意为RX 480设计了一块背板,与此同时,讯景的这块公版RX 480采用了高于公版设定的频率,公版的核心频率为1266MHz,而讯景的这块频率为1328MHz,真可谓是公版中的非公版。
RX 480 CF>GTX 1080?
除了卡,我们还收到了AMD给到我们手里的全新驱动,驱动版本号为16.20.1028。有卡有驱动,还等什么?是时候揭晓RX 480的神秘面纱了!RX 480究竟是和GTX 970性能差不多,还是能追平GTX 980?RX 480双卡交火的性能真的可以同卡皇GTX 1080一战?流言,是时候该终止了,答案,让我们一起来揭晓!
第四代GCN架构亮相
Radeon RX 480不仅是14nm制程的首款显卡,其还采用了AMD全新的GCN 4.0架构。在这里我们先简单回顾一下GCN的四代架构,GCN的初次亮相是2011年的“Tahiti”,对应的显卡是HD 7970;第二代GCN架构诞生于2013年,代表作是采用“Hawaii”核心的R9 290X;第三代GCN我们就比较熟了,就是AMD目前的卡皇——R9 Fury X所采用的“Fiji”核心的架构;第四代GCN架构的代表作正是即将评测的这块RX 480。
Radeon RX 480
Radeon RX 480采用14nm FinFET “Ellesmere”核心,核心面积为232平方毫米。基于GCN 4.0架构的Polaris 10芯片共有2304个流处理器,运算单元数量为36个,TMUs总数量为144个,ROPs数量为32个,四个带宽为64bit的双通道显存控制器组成了总量为256bit的显存控制单元,大小为8GB。
显卡规格比较表 | ||||
显卡型号 | RX 480 | R9 380 |
R9 380X |
GTX 970 |
首发限价 | $249 | $199 | $229 | $329 |
GPU代号 | Ellesmere | Antigua | Antigua XT | GM204 |
GPU工艺 | 14nm | 28nm | 28nm | 28nm |
GPU晶体管 | ? | 5B | 5B | 5.2B |
着色器数量 | 2304 | 1792 | 2048 | 1664 |
单精度浮点 | 5.8 T | 3.5 T | 4 T | 4 T |
ROPs数量 | 32 | 32 | 32 | 56 |
纹理单元数量 | 144 | 112 | 128 | 104 |
核心频率 | 1120 MHz | ?MHz | ?MHz | 1050 MHz |
boost频率 | 1266 MHz | 970MHz | 970 MHz | 1178 MHz |
架构 | GCN 4.0 | GCN 1.2 | GCN 1.2 | Maxwell 2 |
显存频率 | 2000 MHz | 1425 MHz | 1425 MHz | 1753 MHz |
内存位宽 | 256 bit | 256 bit | 256 bit | 256 bit |
内存带宽 | 256 GB/s | 182 GB/s | 182 GB/s | 224 GB/s |
内存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
内存容量 | 8 GB | 2/4 GB | 4 GB | 4 GB |
注:表中售价均为官方首发限价
我们可以看到,Radeon RX 480的默认核心频率达到了1120MHz,Boost频率更是高达1266MHz,这个频率可以说是AMD显卡史上最高频率。RX 480显存带宽为256GB/s,完整支持DirectX 12 API以及异步运算,在DX12中有着更好的表现。RX 480的默认Pixel Fillrate能力达到了40.5Gpiexls/S,默认Texture Fillrate能力为182.3Gtexels/S。凭借高频和庞大的运算规模,RX 480拥有5.8 TFLOPS的高单精度浮点运算能力,照比上代R9 380提升了65.7%,提升幅度相当惊人。
Ellesmere架构图
GCN 4.0架构Ellesmere芯片由以下主要的部分组成:
1、基于三星的14nm FinFET工艺,照比之前的28nm工艺,为每个CU单元带来15%的性能提升,以及高达2.8倍的能耗比提升。
2、与“Fiji”相同的宏观并行结构,36组CU单元被分为4个Shader Engines,每个Shader Engines包含9组CUs。每个CU的Shader效率照比前代提升了15%,同时几何引擎也有所改进。
3、与Shader Engines一一对应的4组Geometry Unit(几何处理单元)以及4组Rasterizer(光栅化单元)。
4、ACE异步计算单元的总量为4组,同时,还有2组全新的,为异步运算设计的HWS加入到架构中。HWS用来更好地对硬件资源进行调度,提高异步运算效率。
5、二级缓存是之前的2倍,在降低显存带宽需求的同时改善电源效率,在显存运行上更节能。
6、重新设计的PCB结构,整个PCB长度仅有17.8cm,可以轻松改成ITX显卡。
AMD公布的RX 480的具体参数
Ellesmere架构的核心设计,即CU单元与Fiji甚至Hawaii相差甚微,绝大部分uncore部分的结构也完全沿用了Fiji的设计,两者甚至连宏观并行结构和缓冲体系都一模一样。Ellesmere与Fiji之间除了CU总量和显存控制器之外,可以说并没有本质性的差异。最大的改进点在于HWS单元的引入,让新的GCN 4.0架构在异步运算方面可以取得更好的表现。
让超频更容易WattMan全解析
用过A卡的朋友们都知道,AMD的驱动控制器中集成了一个超频软件,叫做“OverDrive”,玩家可以通过该软件方便直观地调教显卡性能乃至CPU性能,当然,作为显卡驱动里的功能,我们主要还是用这个软件来方便地为显卡超频/降频、调整风扇转速以及检测显卡运行状态。喜欢超频的玩家们无需再下载一个第三方超频软件,只需要点开控制中心即可轻松实现性能提升。
AMD OverDrive
随着Radeon RX 480的发布,AMD为我们带来了一个全新的驱动内置显卡超频软件,来取代OverDrive,其名为“WattMan”。WattMan的主要功能同OverDrive一样,都是可以控制GPU电压、GPU核心频率、显存频率、风扇转速和温度等,不同之处在于,WattMan为DIY玩家们提供了“精确超频控制”的多种新途径。
那么这个“精确超频”又何从谈起呢?打开WattMan,在界面中部我们可以看到一个拥有7个节点的折线图,每个节点代表一个阶段,整个折线图就代表了频率的变化曲线。我们可以根据自己喜好,自由设定不同阶段频率所能达到的数值以及相应的GPU电压,这也就是说我们在超频时可以做到频率及电压的阶段性微调,不再像以前那样只是将频率拉杆拉高,设定频率的最大值。
用WattMan实现精确超频
使用WattMan的好处主要有两点,一是更省电,二是能够提高帧率。不过全新的WattMan是Radeon RX 400系列GPU才开始支持的功能,经过我们实测,如果你使用的是AMD之前的GPU,超频工具还是我们熟悉的OverDrive。WattMan的使用方式和传统的超频软件比还是有些区别的,接下来就给大家讲讲如何使用这个全新的超频控制软件。
简单频率曲线控制
频率增加30%前后曲线效果对比
既然叫简单频率曲线控制,其自然是给那些超频新手设计的一种简单的超频方式。在Wattman的初始界面,我们看到一条频率的上升曲线,这条曲线是由AMD的工程师设计好的,最适合当前GPU的频率曲线,我们可以以0.5%的幅度来调整整条曲线的高度,最大幅度为±30%。举例来说,将频率拉高30%,这时7个状态点对应的频率都增加了30%,但频率曲线是不变的。这是一种极为方便的,可以提高性能或节能的方法,同之前的OverDrive超/降频方式也比较接近。
动态频率曲线控制
核心动态频率调节示意
动态频率曲线控制比较适合进阶玩家,玩家可以随意调节每个点的频率状态,根据不同的频率设定会呈现不同的频率曲线,让玩家完全根据自己喜好调整频率。当开启动态频率控制时,原先“N/A”的方块变成了当前的频率数值,玩家可以点击方块输入频率值,也可通过拉动频率拉杆来调整频率。
显存电压频率设置示意
频率方块下方是电压控制块,默认状态是自动调整的,玩家也可以开启手动调整模式,修改不同频率所对应的电压。调压有风险,操作需谨慎,笔者我是不建议非高玩人士去调整电压,一旦设定有误,很容易导致显卡烧毁。此外,核心电压和显存电压是彼此独立的,玩家在加压时需分开设置。
风扇转速控制
除频率调节外,风扇转速调节也是非常重要的,我个人的习惯是在超频时将风扇转速手动设置为100%,这样能够保证显卡在超频时不会因过热而down机。在WattMan里,显卡风扇转速控制也变得更为高级,我们可以设定风扇的最低转速以及目标(最大)转速,甚至还可以通过调整转速与频率的关系来控制风扇的噪音(Min Acoustic Limit),而此前的超频软件只能将风扇当前的转速锁定为固定值。
先进的温度控制
温度和功率控制
在风扇控制选项的旁边是温度控制选项,这是一个全新加入的控制功能,有了这个选项,我们就可以控制GPU的最高温度和目标温度。最高温度也被称为“温度墙”,当到达这个温度时,GPU就会通过降低频率来防止自身过热;目标温度是指在此温度下,风扇转速会逐渐提高以增强散热效果,尽量保证显卡不会超过这个温度。这两个温度既可以通过拉杆来调节,也可以直接在方块中填入适合的数值来设定。
在温度控制下方还有一个功率限制选项,这个选项限制了外接供电输送给GPU的电量,上下限为±50%,其专为Polaris 10 XT而设计。这个选项十分神奇,其神奇之处在于当提高功率限制时,不改变GPU频率曲线,就可以让GPU提升一定幅度的性能,而这个选项在我们之后的测试中也起到了很大的作用,能让我们看清RX 480的真正实力。开启功率限制后,显卡的温度和功耗会提升不少,因此需要一个更好的散热设计来压制骤升的温度。
数据捕捉与实时监测
数据监测模块示意
在整个WattMan软件的最上部是一个数据监测模块,玩家可以通过这个模块直观地看出当前GPU的使用率、频率、温度、显存频率以及风扇转速,这些数据通过折线图的形式展现,玩家将鼠标移线上任意一点,该点的数据就可以在左侧显示出来。除了监测,该模块还可以捕捉GPU的运行信息,这些信息可以更好地帮助用户调整GPU的各项参数。
测试平台硬件环境一览
为保证测试能够发挥显卡的最佳性能,本次测试平台采用最强酷睿芯——Intel酷睿i7-5960X处理器、技嘉X99芯片组主板、影驰Gamer DDR4-2400 8GB 四通道内存、安钛克1200w金牌电源组建而成。详细硬件规格如下表所示:
测试平台软硬件配置 | ||
核心配件 | ||
CPU | Intel | 酷睿i7-5960X |
主板 | 技嘉 |
GA-X99-Gaming G1 WIFI |
核芯显卡 | 无 | 无 |
内存 | 影驰 | Gamer DDR4-2400 8GB x4 |
硬盘 | 浦科特 | PX-512M6S+ |
电源 | 安钛克 | HPC-1200 |
系统及驱动程序 | ||
操作系统 | Microsoft Windows 10 | |
主板驱动 | Intel芯片组驱动 | |
显卡驱动 |
AMD Crimson(16.20.1028 WHQL) |
|
DirectX环境 | DirectX 11 | |
帧数监控 |
Fraps 3.5.1 or Benchmark |
测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 10正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
测试平台软件环境 |
||||
操作系统 |
Microsoft Windows 10 专业版 |
|||
(64bit / 版本号:10240) |
||||
主板芯片组驱动 |
Intel Chipset Device Software |
|||
(WHQL / 版本号:9.2.3.1022) |
||||
显卡驱动 |
AMD Crimson |
|||
(版本号:16.20.1028 WHQL) |
||||
桌面环境 |
Microsoft Windows 10 专业版 |
|||
(2560×1600 / 32bit / 60Hz) |
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark及游戏中平均帧数来衡量性能,数值同样越高越好。
理论性能测试:3DMark 11
在进行游戏测试之前,自然是要用权威的软件来看看新卡的实力,首先是有资历的3DMark 11。3DMark 11使用原生DirectX 11引擎,包含四个图形测试项目,一项物理测试和一组综合性测试,并提供了Demo演示模式。该测试程序使用了Bullet物理引擎,使用原生DirectX 11引擎,在测试场景中应用了包括Tessellation曲面细分、Compute Shader以及多线程在内的大量DX11新特性。
3DMARK 11
3DMARK 11 GPU成绩
通过3DMark 11的测试成绩我们发现, Radeon RX 480的成绩稍稍落后于GTX 970,在GTX 970与R9 390之间 ,这的确比较出人意料,之前盛传的RX 480同GTX 980性能相近的传闻不攻自破。难道这就是RX 480的性能水平?有一点需要注意,A卡在3DMark 11里的跑分普遍是要比N卡低的,通过其他显卡的成绩我们也可以看出这点。老3DMark的成绩看完了,我们来看看新3DMark中RX 480的表现究竟如何,新的3Dmark在当下的显卡测试中更具权威性,也是目前被用得最多的显卡性能测试工具(某大娘除外)。
理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、 平板电脑 等等。
3DMark FireStrike
3DMark FireStrike GPU成绩
在3DMark FireStrike Extreme测试中,RX 480的成绩超过GTX 970,但并未超过R9 390。不过这三块卡的成绩相差并不大,彼此之间相差也就50-100分,可以说这三块卡基本就是同一性能级的显卡。两次的3DMark都显示,RX 480同GTX 970的性能在理论上应该是差不多的。不过奇怪的是,RX 480的单精度浮点运算性能高达5.8,而GTX 970的单精度性能只有4,前者是后者的1.45倍,理论上RX 480是可以大幅领先GTX 970的,那么造成RX 480性能不尽人意的原因是什么?
插曲:如何还原一个真实的RX 480
大家知道,供电和散热是可以影响显卡性能发挥的,而散热在公版显卡上一般是不会有问题的,毕竟公版卡的散热系统是经过芯片厂商多方位测试才设计出来的,那么问题可能就是出现在供电上了。其实在之前我第一次见到这块卡的时候就很疑惑,官方宣称RX 480的TDP为150w,但公版RX 480的外接供电却只是一个单6pin,单6pin加上PCI-E所能提供的最大电量就是150w,这种刚刚好的设计我认为是不太妥当的,这种设计会大大限制显卡的超频性能和高负载运行性能,难道问题真的出在这个单6pin上?
寒酸的单6pin设计
在之前我们为大家说过,在WattMan里有一个提升GPU功耗限制的选项,这个选项最大可以拉到50%,在这里就有了一个疑问,设计的毫无余量的辅助供电,是如何撑起这50%的提升的?本着好奇的精神,我们进行了这个Power Limit的调校测试,我们以10%为单位,分别看看提升不同幅度时,RX 480的3Dmark FireStrike Extreme成绩有何变化,变化如下图:
PL提升与3DMark分数关系图
通过上图我们可以惊奇地发现,随着Power Limit的提升,3DMark分数也随之提升,在将PL拉高至+50%时,RX 480的得分达到了5648分,比之前提升了整整5%,与GTX 970拉开了一个较大的差距。这是怎么回事?为什么设计为单6pin的RX 480还能通过解除限制再提升5%的性能?这不科学啊!
我个人分析了一种可能,那就是RX 480的TDP可能是“up to 150w”,也就是说RX 480即使在烤机状态下也是达不到150w的,只有在将Power Limit提升后才有可能达到这个值,而这个值很可能就对应了PL+50%的状态。这也就是说,将Power Limit提升50%后,才是这块公版RX 480的真正性能,而出于降低功耗的考虑,AMD官方在驱动中限制了RX 480性能的发挥。
AMD的显卡频率一向是“Up to”,难道TDP也是?
还有一种可能,那就是由于公版的供电设计只有单6pin,孱弱的供电不足以让RX 480发挥真正实力,为了保证显卡在高负载下的稳定性,不得不通过限制供电的方式来降低显卡性能。可通过我们实测发现,即使将Power Limit提高50%,在运行测试软件和游戏时也没有发生系统不稳定的情况,显卡的温度也没有显著提高,但TDP确实有所增加,这就印证了我的第一种猜测——降低功耗,也许AMD只是为了为环保贡献自己的一份力量?
低碳环保人人有责
当然,以上只是我个人的推测,截至这篇首测发稿,AMD官方也没有正面给出答案。相信大家都想看看RX 480的真正实力究竟几何,正是因此,我们接下来的游戏测试将采用RX 480、RX 480 PL+50%与GTX 970这三组成绩,来还原给大家一个真实的RX 480性能。你问我为什么只对比三个数据?之前笔者我写的首测风格是挑出几个代表性游戏,然后来个显卡群测试,不过有的网友反映数据不直观,而且对比图过于臃肿,弄得跟天梯图似的,因此这次我只列出对位显卡的成绩,但将测试游戏规模扩大了一倍,来呈现给各位网友一个更全面更直观的首测。