大模型引爆数据价值,大华股份如何快速抢占高地?
数据被认为是继土地、劳动力、资本、技术之后的又一基础生产要素。
作为21世纪的新石油,数据存在可复制性、非排他性等特点,使其具备无限的使用空间和增长潜力,成为驱动数字经济发展的原料。
过去十多年,这一要素的价值已经得到初步验证:“数据+技术”的组合应用,造就了互联网平台经济的繁荣,带动数以亿万计的消费市场。
而今,AIoT时代已经来临,数据正以几何速度持续增加。IDC的研究显示,到2027年,全球数据总量将达到291ZB,意味着数据时代的全面到来,而其中视图为核心的非结构化数据会占据90%以上。
随着以CV大模型为代表的多模态AI实现了技术跃迁,其对数据的感知、传输、计算等要求变得更高,形成了关于数据生产、治理、运营的流程闭环。
可以预见,数据作为新型生产要素,已快速融入生产、分配、流通、消费和社会服务管理等各个环节, 以数据为核心的产业链正在形成,数据的行业应用价值进一步凸显,整个数字经济市场将得到大规模释放。
如何激发数据价值,这一问题成为发展数字经济的关键。
10月24日,在2023大华股份“星河璀璨 万象新生”年度峰会上,大华股份软件平台研发部总经理周文凯以《物联数智平台焕新升级,释放数据生产力》为主题发表演讲,并在会后与掘金志记者,就数字时代数据要素价值产业化构建进行了深入探讨。
一、数据时代:新价值、新玩家、新秩序
数据并不是新鲜概念,在国内却是一个新兴的产业。
很长一段时间里,数据是生产经营的衍生品。企业很少意识到数据的价值,或者由于技术缺陷, 即便知晓数据的价值,也因缺少工具而无法提高数据的利用率,很难将数据本身的价值反哺到生产经营活动中,形成飞轮效应。
举个例子,在传统的企业生产经营中,产品从生产、销售到售后,整个闭环会产生非常多的数据。但这些数据只是简单地统计原材料、销量、客户等,方便下一个季度做生产计划。
这种粗糙的经营模式,在竞争不激烈、市场不饱和的行业初期,弊端并不明显。然而一旦市场增长放缓,企业的经营便会受到明显影响。
为了解决类似问题,国内企业引进了ERP、CRM等系统,开启了数字化转型的第一步。随后,云计算、大数据、AI等技术的应用,实现了对数据的利用率进一步提升,这些数据反哺到业务,开辟出全新的增长路径,企业们愈发意识到数据的价值。
2020年4月,数据被首次写入政府文件,并成为与土地、劳动力等并驾齐驱的基础要素, 标志着数据完成了从伴生品向基础要素的角色转变。
“政策的东风已经吹到了数据产业,这个市场正在逐渐扩大。”
大华股份软件平台研发部总经理 周文凯
周文凯告诉掘金志,伴随着制度规范的日益完善、技术体系的逐步成熟以及加速释放的市场需求,数据作为新型的生产要素,对经济的推动作用将愈发明显,并且围绕数据产生的价值链条正在浮现。
周文凯表示,数据的价值链很长,从采集到传输再到计算、治理、应用,涵盖数据资产化、确权、交易、安全等多个环节,每个环节都隐藏着潜在的巨大价值。
从市场参与者的角度看,周文凯认为,未来的数据产业市场,很可能出现一个三级市场。按照产业链上下游角色划分,分别是:上游的数据所有方、中游的数据加工商、下游的数据应用方,三方将围绕数据的价值化和交易展开博弈与合作。
所有方:即数据的产权归属者;
加工方:提供数据采集、存储、传输、计算、治理工具&方案的厂商;
应用方:利用工具发掘数据价值,给终端客户提供服务的企业;
三者之间的关系是, 数据应用方从所有方(运营方)获取数据,利用加工方的工具(方案)做价值呈现,为最终的需求方提供服务。
在整个闭环中,下游应用方最贴近一线业务需求,但很多公司缺乏处理数据的能力,难以在理解客户需求的基础上,利用数据来打通这“最后一公里”的价值闭环。所以, 必然要有加工方的存在,来作为上下游的连接器,提供数字化工具&方案,赋能下游应用方,给最终客户解决痛点,进而打通整个数据产业的价值链。
但要做好这个连接器并不容易,因为在数据大爆炸时代,数据、技术、需求都在时刻变化,企业要在这个动态的变化过程中,去解决客户的痛点,首先要理解变化、拥抱变化。
二、以视频为核心的数据产业特点:类型多、难治理、难计算
伴随着AIoT在千行百业的持续渗透,以视频数据为核心的数据要素市场数据的乘数效应加速价值释放,但仍有海量个性化、碎片化、复杂化、融合化需求未被解决,而随着AI在数据方面的深入应用,极大地提高了数据处理能力和利用效率;同时,基于数据的AI模型、应用,又产生了全新的业务价值,二者之间相互支持、共同成就。
作为AI的进阶态,大模型因其泛化能力强,能够处理更复杂的场景任务,并且一定程度上解决传统AI面临的场景化落地痛点,成为当下AI发展的重点,也是激发数据价值、发展数字经济的重要路径。
但也正因如此,大模型对数据的依赖更强,所需要的数据量是传统AI算法的成百上千倍。传统的模型训练,数据量要求在几亿至数十亿不等,而大模型的训练,则需要千亿至万亿级的数据量。
周文凯表示当前占据数据总量90%以上的非结构化的视图数据,在数据价值化过程中呈现出了场景多样且协议泛杂、数据量大但价值密度低、视图和信息异构数据计算难等痛点难点:
-
协议多、数据格式不统一,导致数据流转效率低
在数据前端集采环节,存在大量的碎片化场景,不同的客户会买多种类型的设备,即便是同一个客户,也会采购不同的产品,并且不同的数据类型对采集的要求也相互迥异。这就导致一个问题:设备之间的协议并不互通,数据格式多样化,不论是数据流转还是处理,都要花费大量的资源。
-
非结构化数据量大、质量低,数据治理难度大
根据IDC的研究,在日益增长的数据量中,绝大部分为非结构化数据,即视频、图片、音频等等,要让AI读懂这些数据,还有很大难度。并且,随着数据量的增加,数据的质量参差不齐,噪音随之而来,很多时候AI会出现“幻觉”(即一本正经地胡说八道)。这些原因都会给数据治理带来困难,当前的技术还不能完全解决这些问题。
-
视频图片和信息化数据交叉计算难,影响业务创新落地
当前AI的大规模落地能够更大范围的提取视频结构化数据,归纳视频采集信息、构建对象关系网络、形成行业知识,通过视图数据与信息数据的融合计算,让视频数据价值升维,但在数据融合的价值计算过程中,视频图片和信息化异构数据交叉计算难,影响业务创新落地。
即便现阶段存在这些问题, 大模型仍然是解决复杂场景问题的最优解,周文凯认为,大模型是一种实现数据价值的手段、方式。其核心价值在于,基于原有的数据,通过大模型的更强泛化能力、更高的准确率和场景的自主解析,能够规模化解决更多的场景痛点,实现业务价值创造。
不过,并非所有公司都具备研发大模型的能力,只有那些既能够接触数据、懂数据,又懂下游客户的业务场景需求痛点,并兼顾极强技术转化能力的公司,才能提供对应的行业大模型,承担起数字经济“连接器”的重要职能。
在AIoT行业深耕多年的大华股份,显然具备这个资格。
三、“天机”+“天衍”,大华掘金数字经济的两个抓手
与市面上许多NLP大模型不同,大华股份推出的“星汉大模型”,本质上是一个融合多模态的CV行业大模型。
大华股份在AIoT行业有着多年的积累,始终聚焦于以视频为核心的数据产业链,“这个市场非常大,能做好就已经足够”。
作为AIoT行业的佼佼者,大华的优势在于, 向下懂视频数据,向上懂业务场景,自身又具备AI和大数据能力。
周文凯表示,数据作为新型生产要素在推动着业务升级的同时也给原有的生产作业工具提出更高的要求。“我们的定位是利用大华在行业的积累,以及以大模型、大数据为代表的技术能力,给客户提供‘数据价值化’的工具,帮助客户解决业务痛点。”
从2010年第一个行业软件平台产品推出至今,大华始终坚持客户价值导向,业务牵引、技术驱动,不断积累行业范式理解,围绕设计、协议、开发、组件四大领域构建了高效的软件工程化能力,在大华提供的工具赋能下,客户能够将所有物联的信息串联起来,根据实际业务做整合、分析、处理,然后做具体的业务呈现。
基于此,大华推出了全新升级的物联数智平台2.0,该平台融合了“星汉大模型”、图数融合计算、算网自智等技术,面向城市、企业等行业场景,构建了“天机”“天衍”两款面向不同客户的产品系列,赋能千行百业。
“天机”系列主要面向G端客户,以城市治理为核心,聚焦“社会安全、城市有序、绿色惠民、治理提效”四个维度,覆盖了超过200个城市场景,助力城市治理效率提升和优化。
“天衍”则面向B端客户,为企业提供数字化管理工具,帮助企业解决业务痛点,寻找新价值,实现数字化转型。
当前,AIoT行业进入了新的发展阶段,呈现出明显的融合特征,包括数据要素的融合、跨行业间的业务融合、算网融合等等。因此“物联数智平台2.0”也必须融合多种能力,才能解决长尾场景下的痛点,满足不同行业客户的需求。
“但大华也不会只提供工具。”周文凯告诉掘金志,AIoT行业有非常之多的业务场景,大华不可能每个场景都能实现覆盖,所以大华也会与懂行业的合作伙伴做端到端的闭环解决方案。
“AIoT这个市场足够大,我们希望能够与行业客户合作,解决问题,用自身的技术能力去提高数据处理、利用效率,在经营上帮助客户;同时也欢迎合作伙伴参与进来,丰富市场,把市场做得更大。”
总结
伴随着国家数据局的揭牌,以及各种政策文件的出台,昭示着数字经济时代即将全面到来。
在大模型技术的加持下,数据的价值得到了有效释放。但对于千行百业的场景而言,当前技术的泛化能力还远远不够,各行各业都存在业务难点,这既需要时间,也需要资源,才能一点点将问题解耦。
有一点可以肯定的是,以数据为核心的价值链将趋于完整,数据资产化价值化、确权、交易、安全治理等都将迎来规范化、标准化,整个数据产业也将形成完整的商业生态和市场秩序。
这条路来日方长,但大华已经在路上了。 雷峰网雷峰网 (公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。