阿里云 all in AI 的决心
如何抓住 AI 的机会?
这是进入大模型时代后,面对新的起点,各大云厂商在不断思考的问题。
毋庸置疑,AI 与云已经成为紧密的拍档。大模型的迭代进化离不开云计算的支撑,而大模型的落地应用,给云计算勾勒了一个比移动互联网更具想象力的新世界。新一轮的云计算周期已然开始了。
在海外,老牌巨头微软凭借 AI 在一年多内摇身变成了最潮科技公司;在国内,阿里云走在最前列,是唯一兼具强大模型和完备云平台的大厂,而且还选择了开源。
事实上,阿里云早在 2019 年便投入大模型研发,2022 年喊出MaaS(模型即服务)第一声,此后又从底层算力(IaaS)到 AI 平台(PaaS)再到模型服务(MaaS)全栈重构,走出了一条云+ AI 的独特路径。从模型到平台到算力底座全方位投入,选择“既要、又要、还要”,阿里云几乎是唯一的样本。
那么,阿里云的“云+ AI ”启示录能成为 AI 时代云厂商变革的新范本吗?
5 月 9 日,阿里云在北京举办 AI 智领者峰会,此时距离通义大模型问世正好一周年。阿里云首席技术官周靖人作了全面总结,关于大模型能力,关于模型落地,关于开源与生态。
01从追赶到并行,技术永远是硬实力
距离ChatGPT 引爆新一轮 AI 浪潮已经一年多,在这段一路狂奔、野蛮生长的日子里,大模型军备竞赛的风从没停过,从架构到参数,从单一语言大模型到多模态大模型,从基础大模型到行业大模型……
“卷生卷死”的百模大战带来的启示是,夯实基础模型的能力,永远是发展的硬道理,技术就是硬实力。
凭借技术实力在云计算时代叱咤风云的阿里云,自然懂得大模型能力的重要性,这是它想要走好“云+AI”的技术路径的关键一步。
结合通义大模型的迭代升级速度来看,阿里云在推进模型能力上的步伐很是稳健。
去年 4 月,通义大模型问世,紧接着阿里云持续聚焦基础模型的技术研发,综合性能超越 GPT-3.5 的通义千问 2.0、通义千问 2.1 相继推出。
如今,在距离通义大模型问世一周年之际,阿里云又带来了最新升级的通义大模型。
5 月 9 日,阿里云首席技术官周靖人宣布通义千问 2.5 正式发布,模型能力再次迎来新突破。
据介绍,相较于通义千问 2.1 版本,通义千问 2.5 的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。
此外,与 GPT-4 相比,中文语境下,通义千问 2.5 文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超 GPT-4!
而在权威基准 OpenCompass 上,通义千问 2.5 得分追平 GPT-4 Turbo——这也是国产大模型首次在该基准取得如此成绩,可谓是“地表最强中文大模型”。
同时,通义还发布了最新款的开源模型——1100 亿参数的 Qwen1.5-110B,超越 Meta 的 Llama-3-70B 模型,成为“开源领域最强大模型”。
不仅是语言大模型,在多模态大模型、行业大模型上,阿里云也在持续发力。通义千问视觉理解模型 、通义千问代码大模型等分别在各大基准榜单上名列前茅。
但单一的榜单数据并不能说明一切,来自用户的使用感受似乎更能说明模型的真实水准。
据统计,如今通义大模型的日调用量早已过亿,通过阿里云服务的企业超 9 万、通过钉钉服务的企业则超过 220 万,通义开源模型累计下载量突破 700 万,成为中国企业最受欢迎的大模型。
虽然已经在模型能力上已经实现了从最初的追赶到并行,但对于阿里云来说,这还不够。
正如周靖人所言,当前大模型有那么多家,大家说的都是同样的故事,但最后比拼的其实是能力差异,以及接下来的如何融合生态(尤其是开发者的生态)、如何落地运用起来,这才是最大的差异。
基于阿里云在大模型能力上的积累,让企业和开发者将模型“玩转”起来,是阿里云要思考的第二个问题。
02全面升级百炼平台,加速大模型落地应用
从去年下半年开始,大模型的战事信号已经开始从“做大模型”向“用大模型”转变。2024 年,商业化、落地应用成为大模型公司的主旋律。
最新的《中国大模型中标项目监测报告》显示,今年 1-4 月,可统计到的大模型相关中标金额已达到 2023 年全年披露金额的 77% 左右,涉及政务、金融、运营商、能源、教科、交通等各行各业,表明企业对大模型的应用需求正快速增长。
但,大模型的落地,并不是通过卷算力、卷参数的“暴力革命”就能实现,中间需要一个漫长的过程。
因为对于基础大模型来说,它所具备的更多是通用知识,但在具体落地过程中,大模型面对的是各种各样的垂直业务场景,而千行百业中的每一个企业都有自己明确、特殊的需求。
如果无法解决这些问题,大模型的落地并非易事。周靖人告诉雷峰网 (公众号:雷峰网) ,在与大部分企业接触过程中接收的需求反馈,让阿里云意识到,“如果不对基础模型进行修整,难以直接对接业务需求。”
基于此,阿里云给出的解法是为用户和开发者提供一个工具平台——一站式大模型和应用开发平台,简化用户在部署大模型时所需进行的底层算力部署、模型预训练、工具开发等复杂工作。
去年 10 月,百炼大模型平台正式推出,这意味着开发者仅通过“拖拉拽” ,5 分钟即可开发出一款大模型应用,几小时“炼”出一个专属模型,大大降低开发门槛。
如今半年多过去,此次 AI 峰会上,阿里云宣布对百炼平台进行全面升级,从模型开发、应用开发到算力底座,变得更加易用、开放。
另外,还引入了更多模型,同时率先兼容 LlamaIndex 等开源框架,企业可自由替换能力组件来适配自身系统。
针对当下企业最关注的 RAG 链路,百炼提供灵活开放的企业级检索增强服务,“5 到 10 行代码”即可搭建 RAG 应用,让大模型拥有“最强外挂”。
具体来看,针对企业应用大模型的三种范式,百炼提供了丰富的模型和易用的工具箱。
一是对于那些希望直接“开箱即用”的企业,百炼集成了上百款大模型 API,除了通义、Llama、ChatGLM 等系列,还首家托管百川等系列三方模型,覆盖国内外主流厂商,同时支持企业上架通用或行业模型,提供足够多的模型选择。
二是对于那些需要对大模型进一步微调的用户,百炼提供从数据管理、模型调优、评测到部署的全链路模型服务,用户可弹性按需调用算力,无需关心底层架构。训练过程可视化,还可自动评测模型质量,并与其他模型对比。
三是对于那些希望打造 RAG 等应用的企业,百炼支持 Assistant API 开发模式,可在百炼上轻松创建知识库,并一键开启知识检索增强(RAG)。
据悉,目前,一汽、微博、小米、完美世界、朗新集团、央视网等企业都已经应用上百炼平台。
03打造开源模型+开放的云生态
技术要有好的发展一定要有生态,而不是闭门造车。阿里云早就意识到了这一点——阿里云是全球唯一一家积极做最先进的 AI 模型同时,也敢于全方位开源的云计算厂商。
阿里云想要打造一朵AI时代最开放的云。
其实,开源VS闭源,一直是大模型厂商所面临的艰难抉择。
坚定闭源路线的企业认为,闭源能够维持技术上的护城河,是更符合实际的理想商业模式。而坚持开源路线的企业则认为,众人拾柴火焰高。
此前,IDC 的一项调研数据显示,在实际应用开发过程中,企业采用开源模型与商业化模型的比例为 51% 与 49%。
而周靖人认为,开源,对整个技术领域的贡献毋庸置疑。开源模型给了企业和开发者更多选择,大家不用担心被绑定在某一家的产品或技术线上,同时也可以最大程度地自由使用不同模型进行应用创新。
“无论是 PC 端还是手机端,要能够与各种各样的场景做适配,快速搭建起更加复杂的业务、AI 系统,其实这都需要一个开放开源的生态,这也是全球开发者和企业在毫无疑问地拥抱‘开源’体系的原因。”周靖人说道。
因此,去年 8 月通义宣布加入开源行列后,便一直坚定开源路线,沿着“全模态、全尺寸”开源路线陆续推出十多款模型。
据雷峰网了解,目前通义已经开源了 8 款参数规模从 5 亿到 1100 亿的大语言模型。
开源的本质是交流,历史上多种技术的突破都证明了这一路径对更大图景的推动作用。打通接口、拉平认知,释放大模型能力,将对整个中国 AI 发展都起到积极作用。
正是早早意识到这一点,所以阿里云在 2022 年的云栖大会上宣布搭建魔搭(ModelScope)社区,这也是国内首个 AI 模型开源社区。
据雷峰网了解,魔搭社区彼时一经推出,便将阿里近五年苦心研发的 300 多个优质模型全部开源,促进中国的 AI 基础研究。
而目前,据周靖人介绍,魔搭社区平台还在扩大建设,平台上的高质量开源模型总数已超过 4500 个,开发者数量超过 500 万,已成长为“中国最大的AI模型社区”。
周靖人坚信,大模型还有很大一部分潜力没有真正被挖掘出来,当有越来越多的开发者、企业能结合自己的需求,来促进大模型的发展和应用,将带来翻天覆地的变化。在当下这个时间点,阿里云希望以开放的心态把最先进的技术开源出来,大家做并行探索。
“这很重要,能对大到每个产业,小到每个企业的创新性开发起到促进作用。”
04写在最后
大会现场,当被问到,曾经在云计算时代拥有绝对领先地位的阿里云(中国第一、亚太第一),如何在 AI 时代继续保持领先时,周靖人沉思了一下,回答道,早在大模型浪潮到来之前,阿里云就已预判业界发展趋势,率先提出 MaaS 理念,布局未来。
2022 年 11 月初,ChatGPT还未问世,在云栖大会上,作为阿里云大模型研发负责人的周靖人即提出 MaaS (模型即服务)——把模型作为重要的生产元素,围绕模型的生命周期设计产品和技术,包括数据处理、特征工程、模型的训练和调优、模型的服务等。
这是一条从未被提及的新概念。
后来的事情大家都知道了,当 2023 年年初 ChatGPT 拉下 AI 新时代的序幕,大模型进入“百模大战”阶段,MaaS 这一理念被广泛提及、验证,并逐渐被亚马逊、微软以及腾讯、百度等国内外云厂商所沿用,将其作为自己在新时代 AI 技术变革中转型的新选择,MaaS 成为最有望改变云厂商商业模式的路径。
如今,距离阿里云提出 MaaS 已有一年多,根据所交出的答卷,可以拼出,在 AI 时代,阿里云基于 MaaS 做出的完整战略布局。
模型层面,聚焦通义大模型的技术研发,将最好的大模型提供给客户;模型服务层,以百炼大模型平台为主要界面,针对企业应用大模型时的需求,提供模型调用、微调、训练、开发专属大模型及应用的工具服务;AI 基础设施层,依靠云计算体系,为其他大模型公司提供算力平台;生态层,持续构建开源开放的开发者生态,推动整个行业的发展。
以模型为中心,全面重构自身技术架构;同时,作为平台,为中国企业、开发者以及大模型生态中的公司提供模型相关的各类服务,最终推动整个产业的共同发展。
这就是阿里云想要在 AI 时代讲述的MaaS新叙事。
“只有这样,在 AI 时代,阿里云才能仍然是 No.1,仍然能为各行各业提供最先进的技术、最广泛的产业应用。”
AI 时代,阿里云将如何保持行业的引领者定位,拭目以待。
雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。