干货解读|从算力、云原生,洞见青云科技新布局

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

AI大模型正掀起新一轮人工智能应用的热潮。

科技 部新一代人工智能发展研究中心日前发布的《中国人工智能大模型地图研究报告》显示,中国10亿参数规模以上的大模型已发布79个。除了百度、阿里、华为等发布了通用大模型,云知声、商汤、科大讯飞等一大批行业企业也推出了大模型,并往具体场景落地。

大模型被认为是百年难得的技术机遇,而无论是通用大模型,还是行业大模型,都涉及大模型训练、数据精调和推理的任务,使得算力需求正在呈现指数级增长。有业内人士曾表示,大约每隔4个月,AI计算需求就会翻倍,比摩尔定律还要快得多。Gartner预测,2025年全球服务器市场规模将超过1320亿美元,其中AI服务器市场规模将达318亿美元。

最先受益的是云厂商,这是由于云计算能够提供大模型所需的计算、存储等资源与服务,并且灵活可扩展、弹性调度,帮助企业迅速起步、降低成本,成为大模型训练、AI推理的必要基础设施。最热闹的也是云厂商,大模型正在带动云业务的发展,各家云厂商也在积极为企业训练和部署大模型提供包括AI算力在内的多元算力。

作为国内众多云厂商之一,青云科技(qingcloud.com,股票代码:688316)面对新的市场需求,也快速走上了新的进击之路:一是构建和不断完善算力基础设施,提供多元算力产品和服务;二是借助云原生技术能力,为企业提供高效便捷的云原生服务,帮助企业实现跨平台的应用部署和构建。

01、算力需求井喷,多元算力如何满足?

云计算经过这些年的发展和普及,企业已经从简单的上云进入深度用云的阶段。尤其是随着数字化转型的深化,这种趋势更加明显。

比如,以前政企或 金融 客户出于合规性和数据安全等考量,并不会把业务放在公有云上,但现在这些客户会将部分非核心业务放在公有云上,以享受公有云的按需获取和快速响应的特性。青云公有云曾为某大型银行提供普惠金融云服务,既实现快速获取计算资源,提高业务效率,也响应了国家金融信创战略,发挥金融对 经济 发展的支撑作用。

与此同时,越来越多传统企业也愿意把相关的应用和业务,逐步放到云上。比如江苏交控基于青云公有云打造了交通新基建,不仅实现了交通部门对高速行车的统一指挥调度,车主也能提前预知路况、收费站是否开放等信息。

不过,当前更大的需求来自于AI大模型。

青云科技副总裁沈鸥表示:“对于AI大模型,我们看到的是企业都有兴趣,在这个领域也想要有所探索。相关AI算力价格随之水涨船高、供不应求。”

“大模型对算力和高速网络有很高需求,同时AI的应用也要求以云为载体,实现即插即用。AI与云融合,对云(计算)的增长空间和发展模式都将产生重大影响。”一位业内人士称。

但AI算力需求井喷的同时,企业在获取AI算力上也存在不少痛点。

首先,AI算力离不开计算、网络、存储等各种复杂底层资源和生态环境的创新与支撑。这些客观因素给企业自建数据中心,带来了非常高的技术和成本门槛。

其次,AI大模型的训练和推理,是一个复杂的技术体系,涉及多元算力统一、高效、灵活的调度和管理。而如何屏蔽底层异构基础设施的差异,按需及时获取不同的算力资源,满足不同业务场景的需求也非常关键。

再者,除了底层基础设施的支持外,强大的技术支撑团队、快速的AI需求响应能力、协助企业快速落地AI应用等方面支持,也是当下企业的全新需求。

打造完整的算力基础设施,一直是青云对外提供算力服务的优势。目前,青云已经形成了覆盖通用计算、高性能计算、科学计算等在内的多元算力服务矩阵,包括企业级e系列云服务器、EHPC高性能计算、QKE容器引擎、分布式存储、企业云平台、超级智算平台等,为企业多场景AI业务开展提供稳定的算力支持。

众所周知,算力更多是资源驱动,本身并没有太高的竞争壁垒。市面上算力资源的提供方众多,但普遍缺乏相应的运营能力。沈鸥认为,算力资源提供方和资源需求方之间往往是不对等的,实现统一的管理运营就变得特别重要。为此,青云打造了多元算力操作系统——超级智算平台。它可以屏蔽超算服务器、AI 服务器、通用服务器等多种异构基础设施的差异,向下接驳异构化的算力和硬件平台,实现对算力的统一纳管、调度、配给和全生命周期管理,进而向上支撑各种行业应用。

清华天津电子院的人工智能大数据中心,就是通过青云超级智算平台对内和对外提供服务的,屏蔽了各种异构基础设施的差异,形成了智慧运营的创新基础设施,服务人工智能创新科研项目。

同时,青云通过高度解耦、分布式的体系架构,还能够把第三方算力资源纳入青云的公有云服务体系当中,为客户提供更加高质低价的算力服务。

另外,青云也在积极拓展与大模型公司的合作,互相补齐能力,比如算力接口和标准协议的建立、成熟的监控运维体系打造,以形成行业方案或者场景方案,满足AI客户更多层面的算力服务和大模型应用需要。

面对企业关注的算力获取和大模型落地“算力规模大、性能要求高、调度困难、训练难度大、数据处理复杂”等难题,青云基于自身多年技术、产品及服务创新,以及在行业上的实践积累,能够为企业提供算力和模型微调服务,帮助企业打造契合业务需求、场景化的专属大模型,提升企业数智化的核心竞争力。

02、云原生大势所趋,云服务走向何方?

几乎所有云计算公司,都在强调云原生战略。

“未来所有的应用都会长在云上。”青云科技董事长黄允松曾说,云原生定义了一条能够让应用最大程度利用云的能力、发挥云价值的最佳路径。

云原生的先进性显而易见。作为全新的IT架构体系,云原生以完全适配云架构的方式实现应用在云上开发、设计、部署和运行。它也可以把一个复杂系统,变成结构化系统,像搭积木一样去搭建应用,不仅能大幅提升系统架构的稳定性,也能实现敏捷创新和降本增效。

干货解读|从算力、云原生,洞见青云科技新布局

当前,云原生正在从概念普及走向规模化应用。根据Gartner的预测,到2025年,95% 数字化运维将通过云原生平台进行支撑,而市场上85%的企业将会使用容器管理服务。容器、微服务、DevOps、可观测性是实现云原生的核心技术和理念。

“当下,企业建设的重心已从基础设施层面,往平台层、应用层上走,更多聚焦在PaaS层,比如数据中台的建设,或对应用进行微服务化改造、搭建DevOps平台。”IDC分析师告诉数智前线。

基于议价权、数据安全等多重因素考虑,多云战略成了越来越多企业的上云和用云的选择。而云原生技术,可以无视IaaS底层的差异性,提供应用服务。在云原生的加持下,PaaS逐渐与底层的IaaS解耦,算力资源服务商和应用服务供应商会慢慢形成两个群体。“青云将会借助云原生的能力,往应用服务的领域走”。

2018年,随着云原生技术崛起,青云科技顺势推出了KubeSphere开源容器平台,成为Kubernetes官方认证的服务提供商,现已发展为全球最受欢迎的开源容器平台之一。

如今,青云已经形成了完整的云原生产品家族,包括KubeSphere容器平台、QKE容器引擎等多款容器产品,以及KSV云原生虚拟化、KubeSphere Cloud云原生SaaS服务平台等,也形成了覆盖多集群管理、DevOps、微服务、可观测性、Serverless等云原生业务场景的解决方案,并积累了大量的生产实践。

容器是云原生最核心的技术之一,但对于很多企业而言,容器和Kubernetes的应用都有不低的门槛。比如Kubernetes学习成本过高,原有的业务架构转变需要花费巨大的精力和时间。

教育赛道的技术服务商红亚科技曾对容器平台提出过三个要求:一是符合Kubernetes生态标准,开源开放,不被某个云服务商绑定;二是部署难度低且操作简便;三是能做统一认证,符合企业组织架构管理体系。

最终,红亚科技采用青云公有云的QKE容器引擎,实现了不同环境多集群的集中纳管,简化了集群运维工作,实现跨区业务部署,支持了超600所高校千人并发在线课堂。

QKE集成了青云云平台的计算、存储、网络等公有云资源,能自动按需分配集群资源,且不用过度担心集群异常和故障影响业务运行。同时,QKE也遵循青云的开源理念,提供不受绑定的云原生服务,可对接多种开源在线服务及产品,可管理不同环境、多个厂商的 Kubernetes 集群,并且提供托管服务,开箱即用。

建筑数字化解决方案公司盈嘉互联通过引入使用QKE的CI/CD功能,完成流水线的自动打包,解决了开发复杂难题,提高研发效率。云南云天化引入青云云原生的设备预测性管理、智能巡检功能,以及动态表单及流程引擎开发工具套件,满足了数字化工厂个性需求。

数智前线获悉,QKE能够为企业提供自管版、托管版两种版本服务,让企业根据业务需求自由选择,并正在研发Serverless版本,真正做到无需运维、开箱即用。

而在SaaS层,青云通过KubeSphere Cloud云原生SaaS服务平台,为客户提供云原生备份容灾、集群巡检、轻量集群等SaaS服务,不受底层平台限制,可以跨越所有的云服务商进行部署,满足客户云原生场景下备份容灾、秒级创建Kubernetes集群,对集群安全巡检防护,保障云原生业务的稳定运行需求。

03、青云持续进化,新篇章如何续写?

从最早上线公有云,服务 互联网 客户,到率先布局“公私一体”架构的混合云,服务中大型企业客户,再到布局算力基础设施,为企业提供云端多元算力,引领云原生浪潮,加速企业落地云原生,青云一路走来没有局限于资源供应商的角色定位,紧紧抓住企业深度用云的需求及其对前沿技术创新的渴求,不断精进,实现自身能力的升级迭代。

在算力领域,最新的消息是,青云即将发布新一代计算型e4云服务器。它搭载了第四代英特尔®至强®可扩展处理器,最多拥有60个内核,最大可支持8路平台,实现了性能全面提升。相比上一代,e4云服务器CPU性能提升50%,存储IOPS性能提升35%,物理网络性能提升100%,网络延迟降低30%,并通过英特尔高级矩阵扩展(AMX)、数据压缩与保护技术(QAT),实现实时推理和训练性能大幅提升,SSL解密效率提升6倍,压缩、解压缩效率提升8-9倍,非常适合企业AI推理、高性能计算、大数据、数据库等业务场景。

顺势打造e4云服务器,将进一步提升青云在多元算力上的能力,更好地为当下最火热的大模型、AI推理等提供服务。

干货解读|从算力、云原生,洞见青云科技新布局

在云原生领域,青云的KubeSphere容器平台也在不断地迭代升级,已经从单纯的容器平台转型为赋能企业转型的数字化运营平台。

众所周知,容器的作用是帮助企业屏蔽底层基础设施差异,高效灵活地调用资源,快速敏捷地部署应用,但企业同样需要能评估云原生效果的工具。为此,青云KubeSphere容器平台企业版对一系列功能进行了迭代,比如全新的可观测中心,能把分散在各个集群的数据汇总在一起,帮助中大型企业客户对配额、资源状态做到精细化管理,并提前预警。

今年下半年,青云KubeSphere容器平台企业版4.0也将上线,其最大的亮点是采用了全新的LuBan架构,实现平台高度模块化,并提供丰富的插件中心,满足企业各种功能和场景需求。围绕LuBan架构和插件中心,KubeSphere企业版将携手合作伙伴、客户围绕云原生展开生态共建,加速企业云原生转型。

03、结语

最近,不少云厂商都有价格战的苗头,但青云科技并没有参与价格战的打算。“价格不会成为企业客户选择某个云的唯一考量,非价格敏感型的客户,更看重服务质量、个性化需求的满足等。”

这也是青云作为独立云厂商的机会,市场比拼的不仅仅是资源和财力,还有对客户需求和技术趋势的精准把握、对云技术实践应用的积累和精进,为企业提供更完善的工具、方案和相关的配套服务,从而真正帮助企业实现业务的持续创新,降低经营成本。

如今,左手AI算力,右手云原生,不断进击的青云,找到了一条更适合自己、也更有市场前景的发展道路。

随意打赏

提交建议
微信扫一扫,分享给好友吧。