从百度「文心杯」比赛,透视国内大模型创业赛道
作者 | Li Yuan
编辑 | 郑玄
向公众开放文心一言 App 抢占 C 端市场的同时,百度加快了 B 端生态的布局。
9 月 5 日,百度举行了「文心杯」创业大赛颁奖典礼暨 Demo 演示环节。今年 5 月 31 日启动以来,「文心杯」创业大赛吸引近千家创业团队报名参加,参赛者基于文心大模型构建了 AI 原生应用,探索商业模式。最终 15 个项目入围 决赛,并获得百度在技术、团队、资源上的全方位扶持。
「AI 原生应用不是简单地重复移动互联网时代的 App,而是要能够解决过去解决不了,或者解决不好的问题。」百度创始人、董事长兼首席执行官李彦宏在百度「文心杯」创业大赛颁奖致辞中表示。
大模型会重塑所有的软件应用——这已经成为当下的行业共识。 今天大模型创业的火热,很难不让人想起移动互联网方兴未艾时,开发者在移动 App 这个跨时代的新平台上摸索产品开发和商业模式的场景。
以海外的 ChatGPT 和国内的文心一言为代表的对话式机器人,是大模型这个新平台上长出的第一个杀手级应用,但大模型的杀手级应用不会只有对话机器人,就像移动时代有了 Facebook、微信后,还慢慢生长出 ins、手淘、支付宝,乃至更具颠覆性的抖音、快手。
今天我们无法断定谁会是大模型时代的微信、抖音,但能从国内第一批开发者中脱颖而出,杀入最后决赛的项目,已经是大模型时代的「种子选手」。
01 AI 原生应用,有哪些可能性
屏幕上的二次元女生打来电话,撒娇说:哥哥,今天我不开心。手机这头的直男对她轻声安慰:「多喝点热水。」
创业团队「你好 Tina」的演示引起了全场的大笑。「那你会喂我喝吗?」主打陪伴的 AI 伴侣做出了人类女孩儿绝不可能的回应,再次引起现场观众的笑声。
文心杯的 Demo Day 上,这样的精彩演示不断出现,频频引起观众席上的阵阵反响。万木健康推出的陶勇医生的数字人科普惟妙惟肖,ChatPPT 的 PPT 演示让大家直呼易用,除了直接的 to C 应用外,to B 应用也横跨了不同领域,文生图文生 3D、数字人、辅助销售、赋能医疗、提升办公效率等方向尤其热门。除了应用层创业外,还有 Vanus AI,这样提供面向大模型的中间件服务的创业者。
根据百度的统计,此次参赛的千家报名团队中,80% 应用大模型进行了应用层的创业,2B 和 2C 应用各占半壁江山。
在众多参赛队伍中,极客公园注意到,搭建 AI 原生应用的方式中,有几个方向尤其热门:
第一是通过大模型搭配知识图谱或者外部数据库,来进行多轮对话。
通用大模型的自然语言能力已经十分强大,但是因为存在幻觉问题,在实际的落地的商业场景中,产出结果并不稳定。而有知识图谱、外部数据库或推荐系统等外部系统辅助,可以产生一加一大于二的效果。
获得大赛一等奖的 Buysmart.AI 是这个方向的佼佼者。采用大模型搭配推荐系统,Buysmart.AI 提供一个可以用自然语言交互的购物推荐平台。用户进入 Buysmart.AI 的网站后,大语言模型会主动询问用户想要购买的商品类型,了解用户的购买需求,向用户推荐合适的产品。
其中的技术难点之一,在于大语言模型与自研推荐系统的适配。「直接让大模型推一个商品是不现实的。它擅长的是与你对话,给它一个命题作文,它的表现会比开放式的题目表现的更好。」Buysmart.AI 的 CEO 陈历飞告诉极客公园,「大模型可以在两个方面帮助推荐系统,一方面可以帮推荐系统获取信息,一方面可以向用户解释,为什么推荐系统提供了这款特定的产品。」
类似的公司包括为医生提供更易查询的创新药知识的零假设公司。在大语言模型出现之前,已经在试图为医生提供一个精准的医学数据库。「大模型的到来解决了易用性。」零假设公司的 CEO 顾飞表示。
另一个热门的原生 AI 应用开发方向,就是文生图、文生 3D 为代表的多模态应用开发 。
自 Midjourney 破圈以来,文生图一直是热门的 AI 应用创业方向。直到今天,这个方向依然热度不减,但在底层模型或多或少都基于 Stable Diffusion、同质化程度较高的背景下,创业公司需要构建起更合适自己公司基因的差异化竞争力。
杀入文心杯决赛的 Genie AI 公司,瞄向的是二次元人群。二次元人群有丰富的改写结局、磕 cp、画同人图和兴趣社交的需求。利用文心大模型,Genie AI 允许用户用自然语言微调 Stable Diffusion 生成的图像。用户不需要输入复杂的 prompt,而是会输入一个完整的故事,就能生成二次元的 IP 二创图。选择这个角度,Genie AI 的用户平均使用时长达到了 26 分钟。
Genie AI 进行展示
另一个多模态应用开发团队 Nolibox,则选择了平面设计生成作为切入点。Nolibox 的 CEO 徐作彪谈到:「大家目前所熟悉的 Stable Diffusion,Midjourney 发力的更多是创意图,就它跟平面设计基本无关的。两者遇到的困难和需要解决的问题,都很不一样。AIGC 让物料生产从有限到无限,从很高的成本到很低的成本,如果要量化的话我觉得至少还 90% 的商业价值还没有被挖掘。」
除了这些 ToC 的应用方向,在 B 端 AI 应用和服务的开发者中,为「销售提升效率」是一个热门方向,其背后有着强烈且明确的客户需求。 除了利用 AI 对话帮助行业客户直接进行销售,还有多家公司选择使用大语言模型分析销售过程,提升销售效率的赛道。
如使用大模型帮助实体门店提升销售效率的数卓科技。通过 AI 和销售录音,数卓科技可以帮助实体销售门店构建用户画像,销售知识库,生成话术,提升销售转化率。「传统销售其实是销售和客户两个人之间构成的一个黑箱。所有的信息其实是记录销售员的脑子里,而管理团队得到的信息是二手信息。」数卓科技的管理者讲到。
他还举了一个具体的例子,一个房地产客户,到访售楼处的客户,平均获客成本需要 3000 元,但转化率只有 5%。「在现在这个高获客成本的这个一个宏观背景下,其实转化率有一点的提升,都十分重要。」
02 依托文心大模型的应用生态欣欣向荣
在 3 月,百度推出文心一言,打响大模型第一枪后。7 月,百度将文心大模型提升到 3.5 的版本。在 9 月 5 日的发布会上,百度创始人、董事长兼首席执行官李彦宏再次宣布,百度文心大模型很快即将升级为 4.0 版本。
经过半年的发展,大模型行业已经逐渐形成共识:大模型技术的本身底座,不是普通创业者能够「卷」的,但基于模型能力,开发多样的应用,却大有可为。 而对于开发大模型公司来说,在大模型研发后,面临的一个新的挑战就是建设一个繁荣的生态。
「模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义。」百度创始人、董事长兼首席执行官李彦宏讲到。
这点在百度的二季度财报中也体现了出来:文心一言产品发布后,百度的智能云销售线索同比增长超过 400%。国际头部券商高盛首次预测 2025 年百度生成式 AI 大模型应用未来的收入潜力:To C 通过广告及 Plug-in 分成,将达到 141 亿人民币;ToB 通过公有及私有云部署将达到 51 亿人民币,可以占智能云收入 15%。
百度对于建设一个繁荣生态有决心,也有行动。5 月,百度宣布计划设立 10 亿人民币的投资基金,表明对 AI 的长期关注及投资的决心。「我相信,文心大模型,将成为 AI 创业者、开发者的首选。」李彦宏说到。
百度创始人李彦宏进行颁奖致辞
而对开发者方面,百度和大模型和平台,也有着相当的吸引力。
实际上,参赛的许多创业企业,最初使用的是海外的大模型,在切换文心大模型试用之后,坚定选择了文心大模型,其背后有几重原因。
首先是模型能力,尤其是中文能力。
「我觉得我们可以代表一批创业者的心路历程。」零假设公司的的 CEO 顾飞表示。「最初我们不太信任国内大模型,总觉得和国外短期内会有比较大的差距。但是真正开始使用改变了我们的看法,当时我们技术团队告诉我说,比我想的要好不少。我们之前也考察过行业里的不同大模型。有的一旦提到开放 api,就不愿意开放了。我们认为不愿意开放出来的,首先就是不太自信的表现。而百度愿意开放出来 api,让我们觉得它对模型能力很有信心。」
文心大模型的中文语言能力,尤其受到多个创业者的认可。Genie AI 的 CEO 彭康伟提到:「之前 4 月开始我们主要使用 GPT,用了一段时间切到文心一言,我们测试下来其实两者从效果的表现上是差不多的,无论模型的微调,还是一些关键词的表述都是如此。但无论从安全角度,还是从中文的兼容性的角度,都是文心会更好一些。我们现在大语言模型方面只用文心一言。」
另一个更现实的理由,在于合规问题。 「文心大模型在合规方面做的很好,符合目前国家对于生成式 AI 的要求,用的话就比较放心。」Nolibox 的 CEO 徐作彪谈到。
此外,选择 Base 在国内的云服务商,也意味着能得到更好的服务支持。 Nolibox 的 CEO 提到了百度在大模型能力之外,对于创业者的帮助:「百度提供了一些更底层的服务比如说百度智能云的算力,飞桨的框架,对我们有很大帮助。」
百度智能云千帆大模型平台
百度飞桨是百度在 2018 年首次推出的开源框架,与 pytorch 的代码逻辑相似,在 2021 年年底,飞桨已经超越其他竞争对手,稳居两个老牌深度学习框架之后,成为全球第三大深度学习框架平台。7 月百度首席技术官王海峰曾透露,截至目前飞桨已凝聚 750 万名开发者。
文心大模型 3.5 训练中采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,采用多种策略优化数据源及数据分布,大大加快了模型的迭代速度。飞桨与文心协同优化,使得文心大模型的 3.5 版本的训练速度达到文心 3.0 版本的 3 倍,推理速度达到 30 多倍。
百度智能云服务,也得到了创业者们的多次提及。本次大赛中,选手们正是通过百度智能云千帆大模型平台调用文心大模型能力。
今年 3 月,百度智能云推出「千帆大模型平台」,目标是降低企业使用大模型的门槛,满足不同行业、不同规模、不同开发能力的企业用大模型的需求。最新数据显示,已有 500 多家生态伙伴通过百度智能云千帆大模型平台使用各类大模型服务,千帆大模型平台上月活企业数超过 10000 家。
近期,百度持续推进多种举措鼓励创业者开发 AI 应用、促进大模型生态发展。百度将拿出数千万元投资「文心杯」获奖团队。除百度「文心杯」创业大赛外,还面向开发者推出 AI Studio 星河大模型社区、插件机制以及文心大模型「星河」共创生态计划。
模型能力突出,拥有合规性,底层服务完善,加上公司层面的高度重视,百度公司正在努力打造中国最繁荣的大模型生态系统。
「未来,我认为中国会有自己的生态系统。中国会出现至少一个、也可能是两个或三个基础大模型,可以支持人们开发各种 AI 原生应用。百度的文心大模型致力于成为 AI 开发者的默认基础模型之一。」李彦宏表示。