数语科技完成数千万A轮融资,全栈式数据治理产品掘金企业大数据
新年伊始,数据治理赛道传来了第一个好消息。
今日,Datablau数语科技宣布完成A轮融资,融资金额数千万。本轮融资由线性资本独家投资,猎云资本担任独家财务顾问。本轮融资后,数语科技计划将资金用于进一步加速重点产业布局,构建基于机器学习的数据资产管理体系。
成立于2016年的数语科技,是国内第一家企业级一站式数据治理平台,依靠数据治理平台与技术服务,持续不断地赋能客户数字化转型能力,加速传统产业的转型进程,提升企业的运营效率,释放新业务增长潜能。
目前,数语科技已经发布了数据建模与模型管控平台、数据资产管理平台、数据资产目录等系列全栈式数据治理产品矩阵,服务客户从金融行业扩展至零售、制造、能源、政府等众多行业。
谈及此次投资,线性资本董事总经理郑灿表示:“在精细化运营的需求下,数据应用越来越普及,但是数据质量成为今天企业数据应用的最大阻碍。我们判断,传统企业在数字化转型中,首先需要保证数据质量和统一组织内的数据标准。这为数语的数据治理产品提供了巨大市场。数语的核心团队来自ERWin,对数据建模有深刻理解。因此和同领域竞争对手相比,数语的产品不仅更标准化,而且和建模工具的结合使得数据标准可以和开发流程相结合,真正做到从源头治理数据。”
什么是数据治理?
在国外,数据治理作为一个传统赛道而存在,其中就已经涵盖了数据架构,数据建模,数据资产管理、元数据等多个板块;而在国内,随着近年来大数据的兴起、企业的数字化转型等,国内也掀起了数据治理的创业风潮。
数据治理,脱胎于大数据的应用与发展。在企业正常开展业务的过程中会生成、采集大量的内外部数据,其包含了大量与业务、客户相关的信息,通过适当的整理和分析,可以为企业带来额外的价值。
随着企业对数据资产的认识与重视,越来越多的企业开始利用大数据、人工智能等技术通过挖掘、治理、分析海量数据以驱动自身业务的增长。但在实际应用中,随着大数据应用快速涌现使得数据处理的复杂度和速度大大增加。
企业早期的信息系统及对应的数据库通常在不同时间、由不同部门各自进行建设,组织内部缺乏架构的规划及统一的标准。目前,大数据应用过程中有三个常见痛点,数据架构混乱、数据标准缺失、数据质量参差不齐,这也直接导致了数据架构与业务流程、应用架构之间的关系不清晰,数据集成和数据共享困难,数据分析及应用效果较差,甚至出现严重偏差。
在此背景下,数据治理就显得尤为重要。数据治理,简单来说,就是在企业建立和规划的数据库中实施各种各样针对元数据和资源库管理的标准。实际上,如果把大数据市场看作一个巨大的金矿,那数据治理就相当于挖掘金矿的铁镐、挖机、钻头等基础性工具。
数据从采集到产生价值之间,需要经历一个完整的生命周期,即采集、存储、处理、分析、应用。针对不同的板块,数据治理提供不同的项目,包括数据标准、元数据、数据模型、数据分布、数据存储、数据交换、数据生命周期管理、数据质量、数据安全以及数据共享服务。
在大数据赛道中,不同企业针对数据治理的不同项目有所侧重,如SAP侧重于数据建模和元数据管理、IBM侧重于数据目录、数据质量和元数据管理……但在产品矩阵上,数语科技独树一帜,通过输出全栈式数据治理产品矩阵,提供数据治理企业级一站式解决方案。
在Forrester NowTech全球MLDC(基于机器学习的数据资产目录)中,数语科技是亚太区域唯一入选的厂商。
全栈式数据治理产品——挖金矿的基础性工具
“从源头治理开始,管理质量,最后通过数据服务,达到数据资产变现 。”数语科技CEO王琤强调。
具体来说,数语科技通过标准化的产品,介入到数据完整生命周期中,打造数据模型工具(DDM)、构建数据资产管理平台(DAM)、提供数据目录服务(DDC)、搭建数据准备平台(DDP),涵盖数据建模、数据治理、数据目录、元数据管理、数据质量等多个能力板块。
其中,数据模型是数据治理中的重要部分。数语科技的数据建模产品的形成离不开创始团队的技术背景。数语科技的CEO王琤、CTO朱金宝都曾在CA Erwin任职,数语科技的技术团队基于过往ERwin产品经验,自主研发的国产数据建模工具Datablau Data Modeler(DDM)。
据悉,DDM可以加速企业信息化研发效率,提高企业IT业务敏捷度,规范数据模型,帮助企业从数据产生的源头开展数据治理工作。
DAM可以实现数据标准管理、指标体系管理、元数据管理、数据质量管理、数据血缘与影响,通过建立数据标准,实现数据的规范和高质量,减少搜索数据时间。
同时涵盖DDM和DAM也是数语科技的优势所在,这两个产品可以直接对接数据标准和数据模型,从开发态到生产态无缝衔接,也确保建模时与实际运行均采用一致的数据标准,并用于进行持续的数据质量监控。
王琤坦言,“在数语科技全栈式数据治理产品矩阵中,就目前而言,数据模型管控、数据资产管理平台是相对成熟且利用率较高的板块,而这两个板块也是数据目录服务和数据准备平台的基础,就像是一步一个台阶一般,只有走好前两步台阶,才能发挥后两个阶段的价值和效果。”
除全栈式产品矩阵外,数语科技还与阿里巴巴为推动企业数字化创新,将数语科技的数据建模产品与阿里的数据治理平台产品整合形成数据治理模型一体化管理解决方案。
“和阿里这次合作其实有一个互补的作用,利用阿里DataWorks(一站式大数据智能云研发平台),加上数语的数据建模工具,为企业客户进行相关的数据模型设计。”此外,王琤还谈到,也正是因为与阿里的合作,数语科技从最初服务的传统企业如银行、人寿保险等客户群体,拓展到互联网大厂。“互联网大厂本身已经有一定的数据治理意识,需要更轻、薄、快的产品,和阿里的合作除了技术探索外,对产品的探索更多。”
目前,数语科技服务客户已经涵盖泛金融、制造业、政府教育、航空、能源等多个行业领域,客户包括中信集团、中国建设银行、中国人寿、华为、国家电网等。
中国人寿就是数语科技服务的典型的案例之一。中国人寿于2018年4月采购了数语科技DAM与DDM两个产品。在此之前,中国人寿并没有系统地开展数据治理相关的工作,也没有意识到数据资产管理工作的重要性。每当发生分析数据的需求时,由分析应用的开发人员在各个业务系统数据库中搜寻需要的数据源,自行编写脚本进行提取和处理。整个流程缺乏规范性,寻找数据源的效率非常低,数据质量没有保证也导致了分析结果的不准确。
由于大数据应用的需求拉动,加上监管机构对报送数据质量的要求,中国人寿于2017年底启动了全集团范围的数据治理工作,以项目组的形式开展,集合了数据建模、数据质量管理相关职能的IT群组及各业务部门。最终,中国人寿通过招投标的形式,确定了采购数语科技的DAM和DDM两项产品。数语科技协助中国人寿部署服务器和对接业务数据库以上线产品,之后企业的IT人员会同业务人员自行实施数据标准的梳理和数据主题域的划分,录入DAM中形成完整的数据目录。
已经走过的2020年,是艰难的一年,但艰难的背后,疫情也加速了企业的信息化、数字化进程,数语科技在数据治理赛道的路,也越走越清晰,数语科技20年收入同比也有翻倍的增长。去年,数语科技发布了Datablau DDM 5.5、DAM 5.5、DDC 5.5等系列产品,形成了从事后模型管控,到事后数据资产盘点,到数据资产价值输出的全栈式数据治理产品矩阵,构建了标准化、规范化、低门槛的数据基础设施。
谈及未来,王琤说道,“新一轮融资将用来打磨产品,建立行业壁垒,提高市场占有率。未来在客户层面除了继续大客户之外,中小企业的数据治理同样值得关注。”