容联云知识图谱Demo论文被数据挖掘顶级国际会议CIKM 2022录用

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

容联云知识图谱Demo论文被数据挖掘顶级国际会议CIKM 2022录用

近日,信息检索和数据挖掘领域的国际顶级学术会议CIKM公布了2022年Demo论文的录用结果,容联云人工智能实验室(Cloopen Research)与南开大学合作的论文《DASH: An Agile Knowledge Graph System Disentangling Demands, Algorithms, Data Sources, and Humans》已被CIKM 2022录用。

CIKM起始于1992年,是信息检索和数据挖掘领域的国际顶级学术会议。

容联云知识图谱Demo论文被数据挖掘顶级国际会议CIKM 2022录用

随着人工智能的发展,知识图谱已成为理解与利用多源异构数据的有效方法。通过实现“数据→知识→知识图谱”的转化,可有效支撑多样化的下游应用,包括智能问答、信息检索、内容推荐、 金融 风控、精准 营销 获客等。

近年来,以谷歌、百度、微软为代表的头部 互联网 企业依托其“数据—业务—技术”的成熟闭环,已经成功实现了通用知识图谱(General-purpose Knowledge Graphs)的构建与落地应用。

与头部互联网企业不同,多数企业需要构建并利用领域知识图谱(Domain-specific Knowledge Graphs)来支撑不同的业务需求。与通用知识图谱相比,领域知识图谱更强调知识深度,是支持Al大脑深度思考的基础,同时也是未来主要的增长点。通过知识图谱技术来量化和刻画企业在物理世界里的生产要素、经营活动、业务知识、业务规则等,是企业的数字孪生智能体。

然而,受技术和成本双重约束,大多数中小型互联网企业、非互联网企业在构建并使用领域知识图谱时仍然面临许多挑战:

挑战1: 在知识图谱构建阶段,如何适应动态变化的知识类型(例如关系、事件、意见要素等)和知识模式(schema)?

挑战2: 在知识图谱应用阶段,复杂的业务场景通常涉及多跳推理、数值计算等复杂查询,如何准确应答?

挑战3: 如何降低算法对人工标注的依赖,实现对新业务、新场景的快速响应?

面对上述挑战,通用知识图谱的成功经验难以直接迁移到大多数企业。因此,构建一套低成本、可迁移的知识图谱解决方案具有重要意义。

为了实现这一目标,论文提出了DASH设计理念(Disentangle Demands, Algorithms, data Sources, and Humans),即在知识图谱构建与应用过程中将“业务、算法、数据、人力”解耦合,最大程度保证算法的标准化,降低企业接入知识图谱的技术门槛。基于该设计理念,容联云开发了一个低成本、可迁移的敏捷知识图谱系统,该系统的整体架构如下图所示。

容联云知识图谱Demo论文被数据挖掘顶级国际会议CIKM 2022录用

容联云知识图谱系统整体架构

具体地,该系统配备了基于多轮机器阅读理解的知识抽取方法(MRC- KE)、分层知识图谱问答方法(Hi-KBQA)和半自动化数据积累方法等先进技术。这些算法具有出色的可迁移性和准确性,在面对新业务、新场景、新数据时,可快速适应少样本、零样本的情况,有效降低系统对人工标注的依赖,实现更快捷的部署实施。此外,平台也允许用户根据业务需求灵活提供“行业知识、业务知识”,进而实现便捷的“人机配合”。

该知识图谱系统是容联云在“通讯+AI”技术的双轮驱动下的新突破,有效推动容联云在自然语言理解、认知智能等方向的技术提升。未来,容联云还将继续深耕AI算法的深度研发,持续投入AI技术与智能化的场景应用挖掘,以领先的技术为企业的数智化升级赋能助力。

随意打赏

提交建议
微信扫一扫,分享给好友吧。