加速大数据、人工智能与超算融合,青云科技带来高性能计算支持

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

对于非IT专业人士而言,大家接触较多的信息和通信设备,通常是个人电脑和 手机 ,很多人都不了解计算机界“皇冠上明珠”的高性能计算 (HPC) 到底是什么样子?

其实,高性能计算,指的是用大量服务器并行地对某一个任务执行运算,来解决工程和科学上的问题。它的用途很多,最核心的是用来模拟世界万物。宏观上,可以用卫星图像、遥感数据、气象数据利用高性能计算来模拟地球、海洋和气候;微观上,青云能模拟分子原子来了解生命的原理,使药物的研发更快速、更精确。

比如,天气预报需要融合几十个纬度的数据,石油天然气勘探需要进行空间分析和建模,DNA测序需要对比成千上万个碱基对等,这些对任意一个单一计算机来说都负荷太大了,而高性能计算可以很好应对。

而现在,高性能计算这一领域出现了一个新的场景,大数据和人工智能正在与超算融合,具体体现在三个方面:

第一,高性能计算跟尖端科研是密不可分的。科学家要让 科技 持续进步,一定要之前的研究人员对更大规模的数据做计算,并且不断提高计算精度。

第二,大数据驱动存储跟算力融合。以前建超算中心的时候,普遍是以算力为主导,但在存储方面出现新的挑战。一方面,现在数据越来越多,比如卫星、无人机在不断产生大量的高精度照片。另一方面,数据类型也在变多,比如可穿戴设备的普及、IoT 的广泛应用,都在不断产生各种新的、不同类型的数据。这些数据都需要利用大数据进行处理和分析。这一改变正在驱使数据中心和算力中心互相融合,并且数据量越大,对应的算力也需要更强。

第三,人工智能应用爆发。人工智能通常指的是机器学习,机器学习最常用的技术是深度学习。深度学习有两个阶段:第一阶段是对大量的数据进行计算,得到训练模型;第二阶段是通过已得到的训练模型,结合新的数据做推理计算,解决实际的问题,比如图像识别、自然语言识别等,都需要推理。其中,训练阶段需要进行大量的浮点运算,为了达到足够的算力,就需要用很多的GPU节点。

为此,青云科技能够为企业提供弹性高性能计算产品——QingCloud EHPC。相较于传统HPC,QingCloud EHPC提供了一种快捷、弹性、安全以及互通的基于云平台的高性能计算服务,它能支持计算资源的弹性定制,降低成本,提高资源利用率,具有极大的灵活性。

针对超算在尖端科技、大数据以及人工智能场景的支持,QingCloud EHPC也给出了相应的解决方案。如超算最常见的仿真和建模业务,青云提供了低延时、高带宽的InfiniBand网络,高速并行文件存储以及CPU/GPU的算力组合,不仅能支持大规模求解运算,还能提供GPU桌面进行图形前后处理,完成一个闭环的业务场景。

对于大数据业务,QingCloud云平台提供的对象存储容量达245PB,跟计算节点结合,可以用于大规模的数据处理和分析。计算节点到对象存储的网络带宽有1.6T,能够保证大数据计算的超高性能。

对于人工智能训练业务,青云提供算力达850PFlops的A100 GPU资源池和全闪并行文件存储,并且能够结合容器平台,提供性能极致优化、轻量便捷、开源开放的人工智能平台。

目前,数字化创新对企业发展和业务创新都提出了更大挑战。青云意识到EHPC将云计算与高性能计算的结合,对于数字 经济 发展有着重要意义。为此,青云科技将紧扣技术发展趋势,继续创新,不断更新迭代弹性高性能计算能力,丰富和完善EHPC方案的能力,持续满足用户高性能计算需求。

随意打赏

提交建议
微信扫一扫,分享给好友吧。