商业智能的 AI 奇点:沿着旧地图,找不到新大陆
" 今年 8 月份以后,有非常多企业客户开始咨询智能化的服务,也提出一起共创。"ChatGPT 火爆之后的半年,帆软 BI 产品运营负责人唐昕开始感受到了来自市场对智能 BI 的强烈需求。
商业 智能 BI 是一套完整的由数据仓库、查询报表、数据分析等组成的数据类技术解决方案。越来越多的企业也意识到 BI 的重要性,据 Gartner 2023 年在中国区进行的调研表示:62% 的中国 CIO 将在 2023 年增加商业智能 BI 的 投资 。
从报表式 BI 到敏捷式 BI,中国 BI 经历过第一波周期,走向低门槛、可视化,让业务人员能够快速托拉拽自定义用数,同时也将后端分析能力搬到台前。
在光锥智能与多位 BI 厂商交谈的过程中发现,几乎所有业内人士都认为, 智能 BI 是下一个阶段。 但从具体动作来看,目前厂商的态度却大概分为两派:
一派是行动派, 在 ChatGPT 出现以后,迅速接入能力开始尝试,如思迈特新版本中着重提到了智能对话能力,网易数帆也在押注 ChatBI、百度 GBI 在内的巨头公司也开始向智能 BI 进行探索和尝试;
另一派则是冷静派, 仍然在保持观望态度和内部探索,并没有迅速上线产品。
" 沿着旧地图,找不到新大陆。" 思迈特软件 CEO 吴华夫认为发展智能 BI 不破不立;网易数帆大模型技术负责人、人工智能产品线总经理胡光龙同样认为:" 智能化将极大降低 BI 用户使用门槛,真正做到人人用数的阶段。"
但帆软 FineBI 产品运营总监唐兴强却认为:" 智能化对 BI 的影响更多在提升效率的环节,核心还是要结合当下场景进一步分析。"
在如同冰与火的对立之下,中国 BI 行业也在争议中,再次进化。
智能 BI 长什么样?
智能化席卷着千行百业,但究竟会带来哪些具体的改变,任何一个行业都还没有定论。
" 大模型+BI,从交互式体验,到编码能力再到推理能力,要一层层叠加到业务里去 ",网易数帆大数据产品线总经理余利华向光锥智能分享道。
用交互式能力降低 " 用数 " 门槛,是智能化的第一阶段。
从微软 PoweBI 开始,对话式 BI 成了大模型+BI 的第一站。国内 BI 厂商也在今年 8 月开始动了起来。
思迈特在最新 V11 版本的产品中,加入了数据模型、指标模型、自助分析、对话式分析等多种智能角色能力,另据光锥智能独家获悉,思迈特不久也将推出问答式 BI;紧接着网易数帆发布了有数 ChatBI 产品,将基于大模型的自然语言理解能力与专业数据分析能力结合;10 月份,押注 AI 应用的百度也将触角延伸至 BI 领域,推出其生成式商业智能产品 " 百度 GBI",可以通过自然语言交互,执行数据查询与分析任务,并且支持专业知识注入。
对话式 BI,即用户通过自然语言即可与 BI 系统进行交互。当对话式 BI 介入后,查找数据的流程被简化为,自然语言询问—自动转化为 SQL 语言—自动搜索数据—转化为自然语言—输出结果。
这种交互方式最大的特点在于大幅度地降低了 BI 系统的使用门槛,让业务人员无需掌握 SQL 等专业语言,也无需深入分析模型,即可获得所需。
但随着企业深度使用体验,对话式 BI 即问题也暴露无遗。例如,搜索过程中,出现了多次搜索数据结果不一样;因统计口径不一致,指向同一个指标的数据无法合并同类项,导致了 GMV 无法与成交金额一起纳入统计。
诸如此类问题,在实际应用中层出不穷,也逐渐让企业意识到: 对话也只是一种形式,而非一种结果。单纯的搜索并不能保证数据得出的合理性,要防止数据变成 " 无源之水 ",还得增加分析的过程。
于是,用推理能力打破分析壁垒,开启了智能化的第二阶段。
智能分析简单来说,就是 BI 系统能主动识别问题,进行根本原因分析,并给出解决方案建议。这背后需要 BI 系统积累大量的领域知识及复杂推理能力。以爱数为代表的部分厂商,正在发力知识图谱和大模型,朝这个方向尝试。
爱数产品副总裁李基亮告诉光锥智能," 只有通过知识的方式,才能在技术上做关联分析。"
比如当数据统计口径不一致时,需要大模型的理解能力理解相近意思的数据,并进行整理和归类。举个简单的例子:统计公司本科以上的员工,这不是关键词的筛选而是理解本科、硕士、博士三种具体的学位。
而在分析层,传统的 BI 软件能够显示数据异常的波动,比如 10 月份销量低迷,智能分析能够通过回归分析模型,对于每一步的数据搜索、分析过程清晰可见,结果归因层层下钻,逐一拆解,再通过 ChatBI 展示影响因素是品牌、客户还是渠道。
再向前展望一步,通过智能体重塑 BI 系统,或许是智能化的第三阶段。
Agent 概念最近大火,未来,也许可以达到万物皆可 Agent 的状态,BI+Agent 也将成为其中一个细分方向。
以光锥智能观察,Agent 对 BI 行业的改造已经开始,有从业者告诉我们: "BI 目前是 Agent 化改造的第一梯队 " ,究其原因在于 BI 系统里本身就含有大量需要自动化的步骤和流程,这与初级阶段的 Agent 十分适配,既能简化流程,提升效率,还能提升调用大模型的基础能力。
未来,更进一步,当 Agent 变得更聪明后,一切过程化将被 Agent 内化为己有。到那时,无论是单智能体还是多智能体都将不在依赖于线性的程序和规划,对 BI 行业带来的结果可能是,系统的界限被打破,服务模型将被重构。
Agent 直接与用户产生互动,用户通过语音或文字,描述业务问题,大模型理解问题场景,自动识别相关数据源,进行分析并输出结果,完全无需搭建 BI 系统。
这种 "BI+Agent" 的新模式,也被业内的一些人视为可能的终点状态。
智能化,为时尚早么?
大模型蒙眼狂奔了一年,也让行业看清了一个现实 " 智能化不是万能解药 ",甚至现在很多行业数字化水平都尚浅,从根本上缺少智能化的基础。
唐昕表示:" 智能化对 BI 的影响更多在提升效率的环节,核心还是要结合当下场景进一步分析。"
这一思路和网易不谋而和,网易数帆大数据产品线总经理余利华认为:" 如果 BI 仅仅叠加了大模型,但不能落地、没有场景,就没有价值。"
反观当下 BI 行业所面临的痛点,并不仅仅是技术难题,简单的讲,并不是智能化缺乏落地场景,而是整个 BI 行业都面临着场景落地的阶段性难题。
不少客户反馈,大模型生成的分析代码质量参差不齐,准确率难以保证。 帆软表示,这就要求 BI 厂商对领域场景有足够理解,进行细致调教。否则用户体验反弹,信任难以建立。
如何理解场景?唐昕举了一个例子,BI 软件具体应该形成什么样的指标,如何能让业务用起来,如何分析产生数据价值,都需要深入行业梳理。
以制造业为例,在制造业里 " 不良率 " 是一个重要指标,那么 BI 介入之后,首先,需要根据行业认知,去确定 " 不良率 " 的特征标准,然后才可以把这一特征揪出来,放到指标库里,通过标准化产品实现复用。
在这一阶段,BI 性能越高就能行业通吃,这就需要把行业经验吃透,沉淀出指标来。毕竟, 金融 级的 BI 要求的是数据敏感,而制造业就不要敏感、需要稳定,行业的经验往往不能照搬迁移。
因此,对于所有 BI 企业而言,在进入一个新行业之时,企业们又回到了相似的起跑线上。
从行业开拓的角度来看,BI 企业开始步入新一轮探索阶段,寻求其他更复杂更边缘行业的落地机会。
BI 发展多年以来,率先在金融、电商、零售等行业落地。例如,网易数帆基于金融机构面临的监管加强、价值体现难、数据质量不足、开发资源紧张等挑战,对于金融机构进行数字化建设,包括数据生产力的提升,其内涵涉及合规、增值(为管理、运营人员等提供即开即用的数据)、可信(业务人员信得过数据及平台,打破数据壁垒)、协同等。
在舒适区探索趋近于饱和之后,BI 行业正在向外探索,例如农业、制造业等数字化程度较低、专业性的行业,成为了下一个阶段 BI 探索与争夺的目标。
而在解决这些痛点难题之后,智能化更多的作用集中在 " 辅助 " 和 " 增强 " 的环节。以爱数客户为例,他们在大模型等支持下解决了数据标准化、业务术语统一等问题,从而提升下游分析建模效率达 30% 以上。
不过," 智能化 " 也并非开挂。
尽管市场上已经出现了各种智能 BI 的概念与尝试,大到行业领导者,小到新晋 创业 团队。但产品落地后,用户普遍反映智能化的效果并不尽如人意。原因在于, 智能 BI 并不是简单架接一个通用型大模型即可高效运转。
未来中国 BI,智能化只是其中一个可能路径。但必须要强调的是,目前无论是国外 PowerBI 还是国内的诸多 BI 厂商的调研来看,客户对于智能化的需求并不强,多半抱着猎奇的心态,感兴趣但不会真的为其买单。
更为关键的是如何从客户场景、行业痛点中汲取经验教训。这是中国 BI 企业在新一轮应用探索中必须面对的选择。
要求数据能力更高,行业重新洗牌
智能化虽然不是开挂,但也确实激活了相对固定的行业格局。最为典型的特点便是今年以来,老选手们奋力创新,新选手们也在排队入场。
不止百度这种大厂开始发力 GBI ( 生成式商业智能产品),SaaS 厂商开始下探 PaaS 层,数据库企业也基于 AP 的分析能力对外向企业提供 BI 服务, 一时间,BI 成了数据产业链的交叉点,整个行业格局也面临着重新洗牌。
智能化对数据能力要求的进一步提升,让更底层的数据厂商积累的能力,得以在大模型时代释放。比如,针对大模型在产业中落地存在着数据层的关键难题——幻觉问题、不可解释性、安全风险等等,爱数方面认为,这并不是大模型的问题,而是数据问题。
数据厂商的基础能力,也是 BI 智能化的下一阶段所需要的核心能力。
比如,企业中常年存在的 " 数据孤岛 " 问题,无法实现数据的有效连接和统一查询利用。而且,多个系统中存在重复和冗余的数据,造成存储和计算资源浪费。同一数据在不同系统中存在不一致版本,数据质量无法有效控制。
这会严重影响分析结果和准确性,这不是上一个系统、换一个工具、买一些 SaaS 产品局部诊脉就能解决的问题,企业需要系统性的、全局性的 BI 产品。
为了打通多种数据源,爱数在数据管道、数据湖仓一体方面进行了探索,也将这样的探索应用在了 RGA(检索增强)技术中,在大语言模型推理生成答案时,额外检索调用外部的领域知识网络,利用综合检索结果进行答案生成。
而智能化产生的新需求对底层的数据能力提出了挑战,这正是全链条工具储备的一个新牵引力。
李基亮举了一个很现实的例子: " 现在我们很多客户都是几百 TB 以上的数据,那平台的搜索能力、对元数据的备份能力、对勒索病毒的抵抗能力,这些很基础的平台能力如果没有,那建好了分析也是空中楼阁。"
" 所以现在不是 AI+Data,而是 Data+AI。" 李基亮强调。
虽然基础工作繁琐, 当智能分析一旦跑通,将成为新的生产力方式。
企业服务往往靠的是经验型产品和服务,行业格局也会更依赖于先发优势和客户突破能力,也正是因此,短时间内,后来者很难颠覆帆软 Top1 的地位。
智能化作为生产力之后,客户的选择更多,也可以通过智能化把需求重新做一遍,这让行业有一个了新的弯道超车的机遇期,甚至像百度这种基本没有涉足过 BI 行业的大厂,也能通过一些 AI 原生的能力切入中小企业,满足不同群体的不同诉求。
智能化为 BI 开启了一扇新的窗口,同时,也将带着厂商走入新的竞争格局。
来源:光锥智能