AMD首发全球7nm CPU/GPU,一举超越英特尔和英伟达?
雷锋网消息,继全球首款7nm手机处理器之后,同样基于台积电7nm制程的CPU和GPU产品也正式发布。11月7日,AMD在美国旧金山的Next Horizon会议上发布了全球第一款7nm 代号“Rome”(罗马)的第二代EPYC霄龙CPU处理器以及Radeon Instinct MI60/MI50的GPU计算卡。
7nm Rome(罗马)第二代EPYC霄龙处理器
首发7nm CPU和GPU
AMD代号为Rome的第二代EPYC霄龙处理器基于Zen2架构,Rome EPYC采用特殊设计的架构,每颗处理器有8个CPU 裸片,每个裸片内集成8个物理核心,共64个。同时为了更好地协调如此众多CPU核心的协同工作,还专门设计了一个I/O裸片,放置在中央位置,专门负责输入输出控制,不过I/O裸片用14nm工艺制造。Rome处理器有8通道DDR4内存控制器,每个插槽支持最高4TB DRAM。
Rome EPYC也是第一个支持PCIE 4.0技术的服务器级CPU,支持128个PCIe 4.0,带宽通道数翻番,可提升加速器性能,搭配同样支持PCIE 4.0技术的全新加速卡Radeon Instinct MI60,AMD表示可以带来前所未有的加速性能。当然,Rome EPYC也是全球第一款采用7nm工艺的数据中心处理器。目前Rome EPYC更详细的参数暂未公布,AMD预测Rome EPYC性能将因核心数量的增加而翻倍,浮点性能也将因为IPC架构的改进和核心数量的增加两倍。
兼容性方面,Rome EPYC与现有的Naples,以及下一代的Milan都将保持兼容,这可以简化基于AMD处理器的服务器开发,也能让服务器公司把现有的设计用在未来的服务器当中。进度方面,AMD正在向服务器制造商提供Rome EPYC样品,计划在2019年推出产品,但具体时间尚未公布。亚马逊AWS计算副总裁Matt Garman表示,基于AMD霄龙芯片的R5和M5实例产品今天就可使用,T3实例将在未来几周上线,并重点强调了帮助客户运行最常见应用程序时节省成本的特点。
GPU方面,AMD在今年Computex 2018上公布了7nm Radeon Vega GPU,雷锋网 《AMD抢先推全球首款7nm GPU,但能否按时出货?》 有详细介绍,不过第一款正式发布的7nm GPU产品并不是Radeon RX游戏显卡,而是Radeon Instinct计算卡。AMD同时发布了Radeon Instinct MI60/MI50,均基于7nm工艺的Vega架构,得益于7nm工艺,Radeon Instinct计算卡集成132亿个晶体管,比目前14nm Vega 的125亿个晶体管增加了6.4%,核心面积为331平方毫米,比现在的484平方毫米缩小了31.6%。据称,在同等功耗下,新核心性能提升超过25%,同等频率下新核心功耗降低50%。
Radeon Instinct显存搭配最多32GB HBM2,带宽达1TB/s,內建ECC纠错。同样,7nm Vega也是世界首个支持PCIE 4.0技术的GPU,双向带宽64GB/s,借助带宽高达100GB/s的Infinity Fabric系统总线,支持4路GPU并行,双路性能提升99%,4路比单路提升298%,8路比单路提升664%。
AMD 7nm Radeon Instinct 计算卡
在加速功能上,7nm Vega计算卡在几个关键领域与Vega10有所不同,7nm Vega支持半速率双精度,同时支持新的低精度数据类型。具体看,MI60 FP64双精度浮点最高为7.4TFlops,FP32单精度最高为14.7TFlops,INT整数最高为118Tops,相比于同样Vega 10核心的MI25专业性能提升8.8倍。
还有值得注意的是,新的GPU还包括一对片外Infinity Fabric链路,允许Radeon Instinct卡通过相干链路直接相互连接。由于每个GPU只有2个链接,因此AMD的拓扑选项仅限于环上的变化,这意味着4路配置的GPU不能全部直接相互通信。另外,AMD仍坚持使用PCIe卡,没有像NVIDIA一样的定制夹层式卡,所以这些卡需要通过顶部的桥接器连接。
为弥补AMD在软件方面的不足,AMD宣布了开源计算平台ROCm 2.0,并继续承诺完全开源。进度上,Radeon Instinct MI50将于今年第四季度上市,MI60将在明年一季度上市。
7nm的胜利?
7nm无疑成为了业界关注的焦点,不过AMD总裁兼首席执行官苏姿丰博士(Lisa Su)此前已经多次谈到AMD的7nm进展。在此次Next Horizon会议上,AMD CTO Mark Papermaster表示,AMD在7nm上豪赌了一把,首先是相信能把7nm做出来,其次是认为7nm将成为产业关键节点,并持续很长一段时间。AMD最初的目标是用自己的7nm和英特尔10nm竞争,至少打成平手,但没想到AMD先做出了7nm,并将成为在新节点上最先推出产品的公司。
除了已经公布7nm架构和产品,AMD还表示明年锐龙、霄龙将全线转向7nm工艺的Zen2架构,接下来将是7nm+升级版工艺的新架构Zen3。不止于此,AMD还首次披露Zen4架构正在设计中。Papermaster也强调了AMD路线图的重要性以及实现路线图的能力和决心,他表示Zen2架构芯片正在流片,Zen3预计在2020年使用7nm+制程,Zen4开发已接近尾声。Zen4是否有机会用上5nm?
一举超越英特尔和英伟达?
在Next Horizon会议上发布7nm EPYC的时候,AMD用一颗Rome EPYC(64核心)与两颗Skylake Xeon 8180M(56核心)同时渲染1080p/QuadHD/4K图像对比,结果成绩分别是28.1秒和30.2秒,AMD更胜一筹。GPU方面,AMD拥有GPU最快配置的1TB/S全内存带宽,甚至超过NVIDIA旗舰产品GV100 GPU。这是否意味着AMD凭借着7nm一举超越了英特尔和英伟达?
雷锋网 (公众号:雷锋网) 在 《AMD的7nm处理器样品出锅了,不过似乎对Intel威胁不大》 一文中已经提到,国外论坛HardOCP上的一位坛友mockingbird爆料称RTG(Radeon Technology Group)已经收到首款Zen 2架构7nm处理器的样品,但测试样品的基础/睿频频率是4.0/4.5GHz,要比目前Ryzen 7 2700X(3.7/4.1GHz)高一些,但与英特尔8700K 4.7GHz的睿频频率有差距,更不及未来9800K/9900K的5GHz。虽然AMD未来还有继续打磨提高频率的空间,但从初代Ryzen测试样品与正式发售产品的频率对比来看,提升空间应该不大。
另外,硬件以及7nm并不就意味着处理器的成功,指令集也十分关键。据了解,AMD先有了SSE5指令集,然后英特尔推出了AVX指令集,接着AMD又效仿AVX,但保留SSE5中的FMA4、CVT16和XOP指令;然后英特尔效仿AMD加入CVT16,但改名为F16C,随后又加入FMA4简化后的FMA3和AVX2.0指令;AMD只得跟风,加入FMA3,承认F16C,将来还要加入AVX2.0。可以看到AMD在指令集方面的竞争非常激烈。
至于GPU领域,从AMD首发的7nm计算卡可以看出其非常重视服务器市场,不过在这一市场英伟达GPU拥有绝对的优势,与在CPU领域与英特尔的竞争一样,英伟达的领先使其有能力从架构以及指令集等方面占据优势,一旦使用了7nm工艺,AMD在部分性能方面的优势能保持多久就不得而知。我们也可以从架构上看,英伟达在今年八月放出了号称12年来的最大招图灵(Turing)架构,但图灵架构的RTX2080 GPU也继承了很多Fermi架构的东西,这意味着AMD也不太可能完全放弃GCN架构设计新的架构,并且此前AMD的研发中心都放在Zen架构上,GPU的改进乏力,基于目前的情况看,AMD能够凭借新的工艺就实现对英伟达的反超?
雷锋网认为,AMD作为在高性能计算领域同时具有CPU和GPU产品的公司十分难得,不过可惜的是在CPU领域难以超越英特尔,在GPU领域难以超越英伟达,这其中有技术的因素,也有商业方面的原因。当然对于消费者和云厂商而言,只有竞争才会带来更好的产品,因此对于AMD的7nm CPU和GPU我们依旧保持期待。
相关文章:
英伟达放出12年来最大招:全新图灵架构登场,全球首批即时光线追踪GPU同步亮相
英特尔10nm制程量产之痛,目标有些“激进”
AMD的7nm处理器样品出锅了,不过似乎对Intel威胁不大
。