电网行业,如何应用自然语言理解技术?
本文分享了智能电网的发展现状与未来趋势,并且具体讲解了自然语言理解技术在电网行业中的应用。
电力网(电网)是高效快捷的能源输送通道和优化配置平台,是能源电力可持续发展的关键环节。在现代能源供应体系中,电网发挥着重要的枢纽作用,关系国家能源安全。2010年以来,国家电网的规模增长近一倍,保障了经济社会发展对能源电力的需求。
随着人工智能技术的快速发展,机器智能的优势正逐渐深入各行各业。本文将聚焦中国市场,谈谈自然语言理解技术在电网行业当中的应用现状与发展前景。
自然语言处理(NLP)技术旨在研究通过计算机设备理解,处理,应用人类的语言文本信息内容,是人工智能研究领域中最为典型也最具挑战的一个部分。
目前,国家电网正在试图将NLP技术运用到电网相关的服务工作当中,通过技术的力量,加速电网行业的发展。
智能电网泛指借助人工智能技术实现的智能化电网。它基于集成的高速双向通信网络,通过先进的控制方法和先进决策支持系统技术的应用,以可实现更可靠,更安全,更高效,为目的的电网服务。从而保障了广大用户额电能质量,推动电力市场的发展。
通过文本阅读理解,文本相似度计算,知识图谱等技术,在项目招标,检测预警,维护修理,以及渠道客户等电网业务的应用场景当中落地。提升电网业务的工作效率,造福广大人民群众。
01 市场规模与发展趋势
2005年以来,智能电网的关注度不断提升,这是现代电力系统日益复杂的体现。智能电网的概念是科研技术、解决方案,以及政策和监管机制的合集。未来几年,新能源装机和发电量占比的提升将是一个必然的趋势,电网将围绕着清洁能源,进行系统化的投资升级。另一方面,中东部地区兴起的大量间歇性分布式电源并网也需要智能配电网络的支撑。
我国智能电网市场的需求方主要是国家电网,南方电网,以及地方供电局和一些地方电力公司。目前,市场上有能力提供较为全面的智能电网解决方案的供应商还十分有限,但是,我们也看到绝大多数企业都已经开始在某个或多个细分领域逐步展开智能化的战略部署。
数据来源:国家电网 前瞻产业研究院
02 相关技术介绍
文本信息抽取
文本信息抽取主要是结合机器阅读理解,通过训练Word2vec模型,将文本数据中有效的信息识别出来,实现自动从文本数据中识别并提取关键信息内容的功能。
文本信息抽取的技术可以应用于电网招标文档数据的结构化存储,便于招标文档的聚类和整理。同时也适用于电网企业说明文档的检测警报等任务。
文档相似度分析
文档相似度分析是依赖文字内容语义相似度计算的技术实现的一种典型NLP任务,一般用于信息检索和知识问答的模糊匹配。
这项技术正尝试被运用于电网维修行业,维修人员可以通过提问,或关键字/词搜索的方式对信息量庞大的电网维修说明文档进行快速的检索,系统可以找到精准的相关内容,并生成说明内容返回给为维修人员。
知识图谱
知识图谱是指包含不同实体之间的信息和语义关联的知识库,能够有效的将系统当中的知识类信息进行整理与关联,从而实现信息数据的相互联结与沟通。
针对包含专业技术和知识类文本数据组建图数据库,从而实现复杂的检索功能和智能辅助决策的功能。
通过图数据库提升文本信息的检索质量,可有效的运用于电网管理监控,电网知识类智能问答客服等场景。
情感识别
感情识别技术指的是通过对工作业务当中对话内容信息的聚类和理解,识别用户在对话内容中所表达的情感信息的技术。
感情识别技术主要依靠长期短期记忆(LSTM)算法,对相关业务对话语料的上下文信息进行深层理解,结合对话当中的语境信息,判断对话内容中所表达的情绪正负极,进而理解对话内容的话题与意图。
03 应用分布与产品案例
电网检测警报
(江苏电网与河海大学)传统的电网检测警报无法对在短时间内对发生的警报事件做出准确的判断。鉴于目前监测报警信息效率低的现状,人工智能技术为电网业务提供了有效的解决方案。
首先,通过NLP技术对报警信息文本的特征进行分析和整理,并做好预处理工作。
之后,基于Word2vec模型对监视警报信息进行矢量化。
最后,针对报警信息的特点,建立了基于LSTM和CNN组合的监控报警事件识别模型。该模型可以通过与多种识别模型的比较,以验证本文方法的可行性和有效性。
智能电网检修问答系统
(南方电网与薄言科技)通过机器阅读理解技术将电网安规的文档进行读取和分析,然后为文档中的段落创建索引。
当电网维修人员向系统提问后,系统会先在索引里搜索相关段落,再从找到的段落中读出问题答案系统依赖bert 模型预测出来文章当中哪一段能回答这个问题的概率最高。(学术的阅读理解数据集上,人能做到86.8, 最好的模型做到88.6了)。
搜索返回的是段落,系统将段落内容转精炼成回答短语,也就是说,系统会先理解文本内容,之后再抽取原文的一部分内容作为答案输出,返回给维修人员。
电网维修人员可以通过自然语言交互的方式快速查阅电网维修文档,从而有效提升电网维修任务的工作效率。
智能电网招标资料查重系统
(国网江苏省电力公司电力科学研究院)电网公司在项目招标采购过程中, 一般要对招标资料进行查重工作,在历史项目资料库中查找是否存在类似项目,以防止项目重复招标的情况发生,避免资金浪费。
使用潜在语义索引的方法, 对文档中的语义进行分析。使用NLP领域的中文分词、词向量转换、词权重计算、主题建模等技术构建一套文档相似度分析系统。该系统可在海量历史项目资料库中快速找出与目标文档相似的项目,并计算出文档相似度百分比,辅助招标采购专职工作人员判断招标资料是否合规。系统的研究与应用,对规范电网公司项目招标采购管理具有重要的实用价值。
局限性与发展趋势
NLP技术在电网行业当中的应用才刚刚起步,大多数案例还处于实验和探索阶段。当前,真正在实际场景中落地的项目非常有限,相关的进展主要来自科研高校以及科技公司的POC项目当中。这些项目当中的数据多为实验数据,缺乏一定的客观性和普适性。从目前的发展现状来看,电网行业中数据的获取和整理将会是一个较大的挑战。
电网领域的内容具有一定的专业性,且需要进行大量有效的人工标注才能训练出一个有效的模型。
此外,电网公司是比较传统的能源类企业,其工作方式以及工作系统已经形成体系。因此,相对于其他行业来说,电网业务智能化的成本更大,门槛更高。短期之内,NLP技术在电网行业中的应用依然是以协助人类工作为目的,而这同样需要相关从业人员接受并掌握新的工作形式与模式。
事实上,中国国家电网和南方电网等行业领头者已经在积极的与多家科技公司和院校实验室进行合作,共同探索人工智能技术在电网电力领域的应用,旨在推动电网电力智能化的战略方针,更好的服务于百姓。未来,将会有更多电网业务相关的数据被挖掘和记录,NLP技术的主要应用场景将不再仅仅是辅助业务的智能客服中心。届时,智能技术将会进一步的深入到电网相关业务具体的管理检测和维护当中。
本文由 @单师傅 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash ,基于 CC0 协议