应用与算力变革,青云QingCloud发布AI算力调度平台

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

每一次 科技 创新都给生产生活方式带来变革,正如移动 互联网 开启万物互联,云计算让企业IT迁徙上云,每一次科技创新都给生产生活方式带来变革。得益于AI高效的生产力与简单的交互方式,青云科技总裁林源认为,新一波AI浪潮在带来生产力变革的同时,还将带来 商业 模式、应用门槛、底层架构等众多变革,产生大量新市场机会。

他表示,相较于过去十年,AI驱动应用呈现四大变化:首先,移动互联网、数字化的服务应用场景,转变为所有应用都要拥抱AI或被AI改造,企业数智化取代数字化;第二,从以CPU为核心变为以GPU为核心驱动应用的创新,“未来的时代一定是一个以GPU为核心的时代”;第三,由于AI训练成本极高,未来AI应用由延迟敏感型转变为以成本敏感型为主,对应的算力将从延迟低的东部沿海,向价格更便宜的西部地区发展,未来算力分布更加分散;第四,支撑的应用类型变化,由传统应用和云原生应用,转变为云原生应用+AI应用,客户业务更复杂,业态更丰富,对技术和平台的挑战越来越多。

过去半年中,随着大模型产品的爆发,AI带来的变革已经逐渐凸显,其中作为AI应用承载的算力格局变化尤为明显。

中国信通院发布的《中国综合算力指数(2023年)》显示,截至2023年6月底,我国算力总规模达到197EFLOPS,其中智能算力规模占整体算力规模的比例提高到25.4%,智能算力规模同比增长达45%,比算力规模整体增速高15个百分点。

AI热潮下,众多智算中心项目如雨后春笋般落地开工,国家信息中心与相关部门联合发布的《智能计算中心创新发展指南》显示,目前全国有超过30个城市正在建设或提出建设智算中心。

在建设如火如荼的同时,智算中心也存在隐忧。林源指出,当前智算中心面临多方面挑战。

对于智算中心的主要建设者地方政府、国资央企和地方AI集成商来说,首要挑战是成本和技术。智算中心 投资 巨大,一台最新的NVIDIA的服务器就要两百万,未来能否收回成本以及盈利,取决于运营效率与平台能力,前者降低成本,后者决定能卖给多少客户。而相比于投资与建设,智算中心的运营更专业复杂,目前各中心运营能力参差不齐,难以应对。

他直言:“行业内大家对于‘智算中心要怎么建?建成什么样?未来要支撑什么业务?’并没有想的很透彻。”因此造成了有智算功能的某计算中心建成后,由于只支持特定GPU,所以缺乏客户,运营不起来的情况。

新一波AI热潮下,智能算力规模将迎来更加快速的增长,智算中心如何设计规划,实现兼顾AI应用、云原生应用与传统应用需求,支持异构CPU/GPU,高效运营达到盈利?

青云的答案是青云AI算力调度平台。

青云科技产品经理苗慧表示,青云AI算力调度平台是包括智算中心在内的算力中心建设的新模式,让算力中心像管理本地资源一样管理AI基础设施,实现多元算力统一调度、智能化算力管理,支持大模型训练场景,提供多种AIGC模型的一站式交付平台,支撑行业应用计算、高性能计算、AI计算等多种应用模式。

据林源介绍,青云AI算力调度平台正式发布前,已经在国家超级计算济南中心(以下简称“济南超算”)应用,取得了良好效果。

济南超算拥有超1000P算力,300P存储,是一个多元异构算力中心,包括HPC、智算和以CPU为主的云计算,既有NVIDIA GPU,也考虑到国产化兼容,拥有一部分国产GPU。自3年前起,济南超算的整个调度平台由青云科技独家供应,运营至今,平稳支撑济南超算来自高校的传统科学计算、政务云和企业数字化应用上云、智慧城市、AI等多类客户群体业务,助力济南超算提高算力资源利用,目前已经实现盈利。

用林源的话说,济南超算案例说明“青云AI算力调度平台具备所说的能力,我们干过,而且干成了。”

随意打赏

提交建议
微信扫一扫,分享给好友吧。