领先容器管理软件提供商Rancher加入NVIDIA初创加速计划
近日,业界应用最为广泛的Kubernetes平台创建者Rancher Labs(以下简称Rancher)宣布加入NVIDIA初创加速计划。Rancher将通过旗下核心产品Rancher2.x和k3s,在数据中心侧和边缘计算侧提升NVIDIA GPU的管理效率,进而帮助GPU进一步发挥AI能力。
NVIDIA初创加速计划,是NVIDIA所推出的旨在培养颠覆行业格局的优秀初创AI企业虚拟加速器,协助构建、支持和培育使用深度学习、机器学习和数据科学的初创AI企业,帮助初创企业加速成长。
“Rancher并不是一家AI公司,而是致力于通过容器实现跨越各种环境和基础设施的计算力灵活管理,后者已经发展成为AI普及的基础能力。”Rancher中国CEO秦小康解释道:“Rancher通过管理任何基础设施上的Kubernetes集群,并与NVIDIA展开合作,进一步提升Rancher2.x和k3s对NVIDIA GPU管理能力,发掘容器和AI结合的潜力,推动计算无处不在。”
AI的未来发展,需要容器技术的加持
Gartner 2019年CIO调查报告显示,过去四年中实施人工智能(AI)的企业数量增长了270%。如此神速的发展,很大程度上是因为NVIDIA这些年在GPU硬件、软件和生态上的不断进取。
得益于NVIDIA的不断努力,全球的AI发展不仅越来越快,应用场景也变得愈加宽泛。从云到端的各个场景中,都有NVIDIA GPU执行AI任务的身影。
云计算的触角已经从云端延伸到边缘再到终端,而AI计算的任务在这个维度上大致可以分为两类:训练和推理。其中,前者主要在云端完成,云厂商大规模部署GPU,通过调用大数据集对神经模型进行高效训练。推理则主要在边缘和终端侧完成,通过驱动少量的GPU或者专有芯片来完成。
AI的高速发展,不仅仅需要上层算法和训练框架的演化,还需要基础设施平台对GPU管理能力的提升。保证GPU能力的灵活调用,才能保证AI应用的高效实现,这其中都存在着不同程度的挑战。
NVIDIA早在2017年就将目光聚焦到了Kubernetes之上,并开始探索通过插件实现Kubernetes对GPU的调用管理。在Kubernetes 1.6版本中,Kubernetes提供了对 NVIDIA GPU容器集群管理调度的支持,进一步提高了对 GPU 等扩展资源进行统一管理和调度的能力。
随着Kubernetes生态的日臻完善,原有常见的深度学习工具都提供了Kubernetes平台的运行版本,如Tensorflow、Pytorch等。这些开源工具的容器化进一步提升了机器学习在Kubernetes上的运行效率,进而增强Kubernetes的机器学习能力。
机器学习是实现AI的普遍认可的方法,而深度学习又是实现机器学习的主要技术,Kubernetes已然成为深度学习工具的主流基础设施平台。
NVIDIA+Rancher,轻松实现基于Kubernetes的GPU管理
Rancher作为业界领先的企业级Kubernetes管理平台,为Kubernetes赋能AI提供了更为简单易用的落地途径。
旗舰产品Rancher2.x是一款开源的企业级多集群Kubernetes管理平台,帮助企业实现Kubernetes集群在混合云+本地数据中心的集中部署与管理。发展3年,Rancher已成为业界采用最为广泛的Kubernetes管理平台,全球累计下载次数逾一亿次,拥有知名企业客户逾40,000家。
k3s是目前业界公认的边缘Kubernetes最佳解决方案。k3s大小仅为60MB,可以减少边缘基础设施服务的资源占用。同时,k3s以其简洁易用的特性,大大提升了用户的运维效率。用户可以专注于GPU和计算框架的管理,而无需深入学习Kubernetes的专业知识。
Rancher 2.x+k3s组成了Rancher“Kubernetes即服务(Kubernetes-as-a-Service)”解决方案堆栈,为Kubernetes集群部署和管理提供了全新的使用方式,大大改善Kubernetes原生学习曲线陡峭及易用性不佳的难题。
更为重要的是,Rancher通过容器为AI提供了无处不在的计算力,无论GPU能力位于云端还是边缘,有力推动AI的行业发展,全面提升企业的AI能力。
“Rancher作为业界领先的容器管理软件提供商,将在加入NVIDIA初创加速计划后,与NVIDIA进行更为深入的合作,结合自身在Kubernetes及云原生领域的发展经验,为企业在云边协同一体的场景中落地AI提供更先进的Kubernetes解决方案。”秦小康总结道。