阿里云发布飞天智算平台 可将AI训练效率提升11倍
8月30日消息,阿里云宣布正式推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,以公共云和专有云两种模式,为各类科研、公共服务和企业机构提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
据悉,飞天智算平台提供基于阿里云磐久基础设施的融合算力和大数据AI一体化平台整体解决方案,可以运行在X86、GPU、ARM等多种芯片类型的服务器上,实现“一云多芯”,并以最高10倍IO优化和5倍通信性能优化,实现90%的千卡并行计算效率。
阿里云智能全球销售总裁蔡英华表示,智算不仅在于规模大,更是需要绿色、高效并且具备产业实践。
绿色技术方面,飞天智算在技术减排、能源结构优化、区域布局优化、供应链减碳以及资源利用优化五个方面来降低单位算力的碳排放。在技术减排方面,通过液冷、电源技术以及智能运维等方式降低能耗,PUE最低可达1.09。
同时,开发人员可以在平台上进行数据存储、数据治理、数据分析、模型开发、模型训练与推理的工作。并提供了预训练模型,以及语音,图像、自然语言处理、决策等领域的模型能力,以方便开发者更好的加速AI应用的开发。
目前,该平台正在支撑建设两座超大规模智算中心。其中,张北智算中心建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力,将超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心。乌兰察布智算中心建设规模为3 EFLOPS(每秒300亿亿次浮点运算)AI算力,位于“东数西算”内蒙古枢纽节点。
据介绍,飞天智算平台已在阿里内部广泛应用,支撑阿里AI日均1万亿次调用,服务全球10亿人。其中,拍立淘训练速度提升了200倍,10亿张图片全量训练时间从2.5个月缩短到8小时。达摩院大模型M6仅使用512张GPU,在10天内就完成了10万亿参数模型训练,能耗仅为GPT-3在同等参数规模下的1%。
同时,飞天智算平台已服务了小鹏 汽车 、深势 科技 、上汽集团、中国气象局、南方电网等机构和企业,支撑自动驾驶、新药研发、气象预测、工业能源等行业大幅提升AI训练效率。
来源 / Techweb