解析 | 如何构建知识图谱
编辑导语:知识图谱可以说是一个数据库,在如今大数据时代,知识图谱已经是企业中能够起到很大作用的一个环节,可以提高工作效率等;本文作者分享了关于构建知识图谱以及问题的解答,我们一起来看一下。
知识图谱作为大数据内容的搬运工,在知识算法和使用上,能够放大组织沉淀数据应用价值;目前搜索巨头、购物网站均已经通过应用知识网络,实现了更深层次的“千人千面”。
知识图谱,让用户能够查询到更多潜在内容,为组织节省了大量的知识重复和调阅工作,提升隐形竞争力。
本文,将从知识图谱概念和应用两个角度,帮助看到的您,了解熟悉知识图谱工具,为工作过程降本增效提供新的选择。
知识图谱,是一种复杂网络型知识工具,在2012年由谷歌公司提出,当时的目标是——让搜索找到答案;到如今,随着大数据应用深入大街小巷,知识工程算法能力的得到优化,知识图谱已经成为一家企业能够整合内部资源,更好服务于客户的重要一环。
一、概览知识图谱
概念:本质上看,知识图谱,是一种大规模语义网络,可以算作是知识工程学科的代表。
形式:网链结构,有核心节点,是大数据的价值载体。
应用:知识图谱的使用较为灵活,一方面,可以单独进行使用,作为数据的加工方,直接对接原始数据,从源头进行数据清洗和知识数据图谱关联呈现;另一方面,还可与其他系统进行对接,在有数据沉淀一方,进行实体抽离,在知识图谱端进行知识加工,最终将知识网络和潜在关系,提供到知识使用人员。
二、举个例子
如果说,目前的感觉还不是很直观的话,让我们来一起接受一项知识图谱的构建任务:
1. 任务场景
现在,一家企业求助到你,通过与他进行深度访谈和业务调研,企业面临着以下几点问题:
1)企业人员流动性高,包括新员工和培养了一段时间的经验员工,人员流动的背后,代表着工作经验、知识沉淀的流失,需要耗费更多的精力去做好整理和传承工作;
2)企业知识纷繁复杂,关于工作的相关知识内容,尚未形成体系,很多员工经常需要寻找老员工进行请教,或者想要自学,却总学到的边边角角,难以系统了解知识体系;
3)企业知识成本较高,企业最重要的浪费,就是知识经验的浪费,而企业将知识转化为工作内生动力的过程太过复杂,将潜在影响到企业的运行效率。
2. 解决方案
针对分析出的几项内容,提出利用知识图谱来解决问题,有以下几点优势:
1)打造知识网链化:对沉淀下来的非结构化知识(音视频、图片)、半结构化知识(FAQ)、结构化知识(文档),进行数据梳理,对适合进行FAQ拆分的知识进行二次拆分。
2)实现知识谱系化:对拆解好的知识内容,利用知识关联算法和图谱算法等,构建知识谱系,形成图网,对实体、概念和语义关系进行抽离,让知识之间形成关联。
3)构建知识协同化:对已经整理好的内容,进行数据整合,将知识内容与沉淀数据进行匹配,生成供前、后台企业人员均可以使用的知识资源;前台人员利用知识图谱,识别到客户画像和营销内容之间的匹配,后台服务人员利用知识图谱,识别到客户想问的,和潜在要问的,进一步实现精准服务。
3. 优势
知识图谱的使用优势,总结为以下三点:
1)搜索优化:让每一位知识的使用人员,在搜索时,能够匹配到精确的搜索内容和拓展的相关性、联想性知识内容。
2)知识学习:让每一位知识的使用人员,能够在搜索出结果以后,推荐相关知识,供其调用和使用,并且通过图谱网络的方式,展示出知识之间的谱系关系,提升知识的自学能力。
3)数据匹配:将知识网络中的内容,和其他系统沉淀数据,进行深度优化匹配,并且加工形成更加精确的知识数据,提升场景应用范围,例如关联行为图谱、数据关系图谱等。
三、Q&A
对于大部分人而言,知识图谱,作为一件知识工具,将知识内容,梳理成为知识图谱能够识别的格式,并能够加以应用。
现如今,知识图谱已成为大数据知识工程的代表,但是大部分人在使用的时候,会陷入几点误区,而这个误区,会成为能不能用好知识图谱的关键内容:
1. 知识图谱是不是整理文件夹?
很多人将知识图谱的应用和知识整理的过程联系在一起,这一点是正确的,但是如果把知识图谱的应用仅仅当作是知识整理的过程,就会缩小知识图谱的价值。
从逻辑上看,知识图谱与整理文件夹是包含关系,或者说整理文件夹是一个过程,这个过程是知识图谱应用的基础,在此基础上,能够更好的放大知识图谱的作用。
2. 知识图谱是不是需要很强大的系统支撑?
对于绝大多数的知识图谱,需要有算力提供支撑,系统大小不重要,重要的是系统内的知识体系是否足够清晰,是否能够被知识算法合理高效的抽离和应用,对于知识的处理更加重要。
很多组织的知识存储,要进行改良,将线性的知识,转化为二维、族谱式知识,能够帮助新员工更快了解组织的核心知识,迅速开启工作内容,创造更大的价值。
入了知识图谱的门,才发现知识图谱的深奥,神秘的面纱下,是大量知识基础工作的沉淀,积跬步方至千里。
本文由 @汪仔没有奶 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自Unsplash,基于CC0协议。