CNCC 2020 | 国双:以业务场景为驱动,实现数据、业务治理迭代闭环
10月22-24日,计算领域年度盛会——2020中国计算机大会(CNCC2020)在北京举行。国双董事长兼CEO祁国晟受邀参与,作《以业务场景为驱动的数据治理——实现企业数字化、智能化转型的必经之路》主题报告,与图灵奖获得者、两院院士、国内外顶尖学者共同展望大数据、人工智能前沿趋势,分享国双技术创新成果。
国双认为:高效地获取、集成、治理、管理及运用“数据”和行业“知识”是大数据与人工智能技术在企业、政府组织的数字化、智能化转型中实现场景化落地的先决条件。新型数据治理需要在“场景”的驱动下,形成“数据”和“知识”的双轮驱动,实现数据治理、业务治理的迭代闭环。
图:国双董事长兼CEO祁国晟
传统数据治理中,人们常常从“数据”出发,将多源异构的不标准、不一致、不完整、不及时的数据通过质量管理、生命周期管理、元数据管理等过程进行治理,并没有很好的场景化落地,应用效果也欠佳。在新型的数据治理中,我们可以从企业生产、经营、销售,政府的管理等实际业务应用场景出发,将业务中的“知识”沉淀下来、数字化之后,形成数据图谱、资产图谱、业务图谱、流程图谱、指标图谱等融入到数据治理中,形成“数据”和“知识”对业务的双轮驱动。
图:国双数据治理的双轮驱动
作为非常重要的一层,“知识”一方面将“业务”与“数据”关联起来,让机器知道什么业务场景需要什么数据,这些数据必须达到怎样的标准和质量,进而帮助数据治理;另一方面,通过数据治理所形成的业务发现,或者是数据治理本身的方法、其他产出,又会沉淀成新的“知识”,在数字化转型中释放价值。
图:知识在数据治理中的作用
会议当天,祁国晟先生还结合国双实际案例,介绍了国双新型数据治理在司法、油气、审计领域的应用:
司法 :谁 是好法官?
法院有立案、审判、诉讼管理、执行管理等诸多IT系统。除了当事人信息、标的、法官信息等基本信息之外,系统中还包含受理案件数、审结案件数等统计。基于现有数据,法院考核法官时,常常会用到结案时间,也就是一个法官在一段时间内办理了多少案件作为绩效的重要依据。而在实际办案中,一些复杂案件常常会分配给资深法官,1个案件耗时6个月办结是常态。一些简单案件则会分配给新手,一位刚入职的法官就可以办理民间借贷案件,一个3人审判团队月结案50-60并非难事。这样一来,资深法官因为办理复杂案件,用时长、绩效低,年轻法官则因为办理简单案件,用时短、绩效高。
影响案件审理时长的因素非常多,比如,应当出庭的当事人或证人正当理由未能到庭(疫情、疾病、地质灾害、政治封锁…)、当事人要求对特定财产进行评估等等,对每一个案件分类非常复杂。为了解决这一问题,国双通过文本解析技术,将起诉书、答辩书、裁判文书等文本中的要素要点进行提取,构建知识体系和知识图谱,将这些要素作为字段补入到原有数据中,并将不同的数据进行融合。在此基础上,通过搭建类案模型,系统可以自动对案件进行分类,案件难易程度被引入到原有的评估体系中。
好的考评体系可以提升办案效率。在以知识和数据双轮驱动建立考评体系的过程中,,国双还为法院研发了司法文书自动撰写、类案同案智能推送等多种办案辅助工具,进一步提升法官的办案效率。
油气 : 向数据要储量,向数据要产量
石油勘探开发是一个知识密集型行业,很多宝贵数据却因为没有治理好而沉睡在数据库中,没有完全发挥其价值。现有勘探开发数据,部分在数据产生过程出现问题,比如命名规则不统一,将同一业务对象命名成不同的形式,无法进行有效油藏类比;部分是在数据治理过程出现问题,比如误删除,数据缺失;还有一些存在业务逻辑矛盾,需要业务人员才能发现问题,比如孔隙度的计量单位没有统一,误将6%输入成了0.06,系统按照0.06%计算,严重低估了油气储量,错失优质采油机会。
为了解决这些问题,国双将知识融入数据治理,提升数据质量:依据业务特征和名称,我们可以推理几个不同名称的小油层实际上是一个油藏;依据业务知识,我们可以推理出对于同一口井的小层产量,如果生产时间连续,那么可以从业务上判断生产层位应该相同,数据库中缺失的层位信息可以与上下行的层位信息保持一致;针对计量单位不统一的情况,可以运用业务知识,设置数据下限,降低计量单位等录入错误。
基于新型数据治理,我们助力油气行业实现“向数据要构造、要圈闭、要储量、要产量”的目标,提高油气从业者的工作效率、降低勘探风险、提高采收率。
审计 : 新型数据治理下的行业 产业 之变
传统审计工作本身就是从数据治理实践展开:初级审计师花费大量时间进行数据标准统一、表格拆分、表格合并等基础数据处理工作,形成关键信息表后,交给高级审计师;高级审计师结合行业知识与业务经验给出行动纲领,循环往复。而在新型数据治理中,在审计初期便可以将领域知识融入其中,大幅提升审计师的效率、解放人力,让初级审计师能拥有更加高阶的业务知识,实现审计服务的升级。
在这个过程中:
通过提升审计业务质效,可以赋能审计行业;
通过审计工作提升企业财务风险管控能力,可以赋能产业;
通过审计工作提升税务风险管理能力,可以赋能社会治理。
“数据”与“知识”双轮驱动的新型数据治理是国双产业人工智能的又一实践,也是国双"把人从 经济 社会常规运营的繁琐工作中解放出来"这一目标的探索成果。未来,国双将继续不断研究和突破关键技术与算法,结合场景化落地能力,为新基建与企业数字化、智能化转型提供强劲动力。