智能变革:英特尔HPC高性能计算与AI人工智能解决方案和实例
在竞争日益激烈的环境中,数据中心作为传统信息化的基础,伴随着全面AI时代与5G、物联网的不断临近,企业希望获得出色的模拟和建模、人工智能(AI)和大数据分析功能,以便取得突破性的发现与创新,而高性能计算(HPC)基础设施能够为这些工作负载带来优势。
企业如果想在相同的 HPC 基础设施中运行 HPC、大数据分析和 AI 工作负载,优化的资源调度降低计算成本需要一个全面的融合HPC和AI集群的解决方案。
英特尔® 精选解决方案基于英特尔® 至强® 可扩展处理器而构建,支持 HPC 批处理调度程序在通用 HPC 基础设施上运行所有工作负载,包括模拟和建模、大数据分析和 AI。针对各种计算、存储和网络资源进行优化,从而满足特定工作负载的需求,探索更多的设计参数、降低企业成本,缩短生产时间。
解决方案
英特尔® 精选解决方案由英特尔投入巨资将至强® 可扩展处理器、英特尔® OPA 和其他技术结合在一起,经过OEM/ODM、专业ISV软件和英特尔认证,有助于轻松构建 HPC 集群,支持在相同的 HPC 基础设施中部署,相同的 HPC 集群上运行机器学习、深度学习训练模型和数据分析。例如,解决方案可帮助用户在 HPC 系统上运行英特尔优化的 TensorFlow模型(一款基于Python的深度学习框架,可在现代深度神经网络上轻松使用与扩展,并且针对英特尔®至强®处理器进行了优化)。
英特尔®至强®可扩展处理器
第二代英特尔®至强®可扩展处理器是强大计算集群的核心,在高性能计算 CPU 基准测试中实现了高达 3.7倍的平均性能提升。在LINPACK* CPU 基准测试中提供了高达 5.8倍的性能提升和高达 1.7倍的每内核浮点性能,实现了高达 25倍的推理吞吐量提升,支持更高的数据和工作负载完整性及合规性,以 经济 高效、灵活的方式提供高可扩展性。
英特尔®至强®可扩展处理器中集成的以下英特尔技术进一步提升了系统性能与可靠性:
英特尔®AVX-512:提升了要求最苛刻的计算工作负载的性能,相比前代英特尔处理器,可将每时钟周期每秒浮点运算数(FLOPS)提升高达两倍。
英特尔® DL Boost:将性能加速扩展至整数运算,提高峰值运算速度,可处理 CNN 和 DNN 工作负载特有的密集计算,加速人工智能深度学习(推理)工作负载。
英特尔® Cluster Checker:可在节点和集群级别对系统进行检查,以确保所有组件能够协同工作并获得最佳的性能。
英特尔® Cluster Runtimes:针对基于英特尔架构的集群提供优化的卓越性能,提供每个集群所需的关键软件运行时元素,以确保为每款应用提供最佳性能路径。
基于英特尔® 至强® 可扩展处理器的融合并行编程:提供了一个基于通用编程模型的超灵活框架,支持创建高度集成的技术、软件工具和库组合,支持在各
种人工智能框架内开展代码现代化项目。
英特尔® 至强® 可扩展处理器最高拥有56个核心,支持更高的内存速度(最高2933 MT/s)、增强的内存容量(每路最高4.5 TB)和八路可扩展性,为了应对不同的性能需求,处理器则分为不同型号。
铂金 9200 处理器采用全新的英特尔® 深度学习加速指令,专为高性能计算、高级人工智能和分析而设计。
铂金 8200 处理器专为关键的实时分析、机器学习、人工智能和多云工作负载而构建,提供可信的硬件增强型数据服务。
金牌 6200处理器优化了主流数据中心、多云计算以及网络和存储工作负载。
金牌5200处理器经济实惠,具备出色的可靠性和硬件增强型安全性,可提供更高的性能。
银牌 4200 处理器提供基本性能,改进了内存速度和电源效率,提供入门级数据中心计算、网络和存储所需的硬件增强型性能。
铜牌处理器具备硬件增强的可靠性、可用性和可维护性,提供了基本存储服务器入门级性能,满足这些入门企业的基本需求。
英特尔® 至强® 可扩展平台
搭载了第二代至强® 可扩展处理器的英特尔® 至强® 可扩展平台是一种面向未来的平台,能够充分实现英特尔® 架构在HPC和 AI 方面的能力,为企业创造更高的价值,带来更高的性能。
可扩展平台设计宗旨便是通过优异的可扩展性将实现计算、内存、存储和网络性能的最大化,同时也是为人工智能提供了一种通用平台,内置人工智能加速并已针对工作负载进行优化,无论是对于推理还是对于训练,该平台都具有很高的吞吐量,也可为分布式并行计算集群提供更高的性能和扩展性,可构建不受互连约束的大型 HPC 解决方案。
实际案例:
深圳市宝德计算机系统有限公司拥有亚太地区最大的服务器研发生产基地之一,以研发、生产、销售Power-leader品牌的服务器和解决方案为主要业务,二十多年来保持稳健发展,稳居国产服务器第五位和全球第九,是中国服务器市场的精锐企业。
宝德高性能计算方案采用集群体系结构,遵循Intel开放的HPC生态体系架构来系统的部署所有的软硬件,针对大规模科学并行计算设计,兼顾事务处理和网络信息服务,可以有效降低能耗,是最新技术结晶和未来的主流发展方向之一。
方案中共配置1个管理节点,10个计算节点,千兆交换机管理网络系统,Intel® Omni-Path 100Gb网络作为高速计算网络,共同构成了高速计算、海量数据传输的网格计算集群系统。
管理节点和计算节点均选用宝德推出的一款主流2U服务器产品PR2710P。它采用Intel® C620系列高性能芯片组,支持第二代英特尔®至强®可扩展系列处理器,最多支持内存容2TB,默认支持8块热插拔 3.5寸硬盘,可选支持12盘/24盘版本,并可选扩展全高全长的PCI-E设备,可选采用英特尔®FPGA和傲腾数据中心级持久内存,支持Infiniband、Omni-Path高速网卡。PR2710P提供先进的管理功能和存储技术,具有可靠的可扩充性和高可用性。该方案所有计算节点服务器CPU采用Intel® Xeon® Gold 6248,具有20核、40线程、27.5MB缓存、150W TDP,基准频率2.5GHz,可以超频至3.9Ghz。
为了更大地发挥HPC集群的计算性能,提高集群计算节点之间的网络,方案采用了最新的Intel® Omni-Path网络互联解决方案。Omni-Path Architecture ( OPA)是英特尔在True Scale架构和标准InfiniBand的经验及教训上,针对HPC开发的一种高性能网络架构,是一项专为优化高性能计算的全新互联技术,也是一款端到端的互联解决方案,可针对入门级和大规模高性能集群经济、高效地提升性能。
总结:英特尔® 精选解决方案是根据组织具体需求定制并预先验证的软硬件构建模块组合,提供了可预测、可靠的超凡性能,充分利用现有的所有资源,能够在提高性能的同时,降低终端客户实施数据中心现代化的难度,并规避相关风险,是运行HPC、AI 和大数据集群这些工作负载的最佳选择。