明略科技的工业互联网思路:数据、AI、知识图谱
工业互联网是中国工业从「中国制造」到「中国智造」的一个转折点,也被认为是中国可能存在的工业弯道超车的契机之一。
中国企业面对这个契机,尚有一个问题需要考虑——过去一百年欧美走过的工业化道路是否仍需国内工业产业继续跟进研发、“跑数据”?
行业内的一个普遍认知是,中国工业化道路仍需从数字化、甚至自动化继续长跑补课。
然而,就当下这波工业互联网热潮而言,中国企业的热情已经远超欧美及其他国家,正如麦肯锡全球资深董事合伙人、亚洲运营咨询业务及物联网负责人Karel Eloot向雷锋网提及工业物联网趋势时所谈,“在中国,人们非常热衷于思考工业物联网,原因是他们认为这是一种更快缩小与发达国家差距的方法,是一种跨越式的进步,而不仅仅是从法国或德国学习成功经验。”
在这样的背景下,中国企业出现了诸如三一重工孵化的树根互联、TCL孵化的格创东智这样的工业互联网平台厂商,也有阿里、华为等互联网企业的入局,以及在工业互联网平台、AI算法、大数据等方面的诸多创业企业。
其中,工业互联网平台、AI算法及大数据成为当下国内工业互联网创业中两大热门创业方向,明略科技属于后者,主要构建了自家的AI和大数据平台。
明略科技成立于2014年,随着2019年3月明略完成20亿元D轮融资,明略数据升级为明略科技集团,随后又公布了新的人事任命,任命丁伟庆为明略科技集团高级副总裁,主要负责明略科技集团公共服务事业群旗下工业及物联网业务并协同公共服务事业群整体管理工作。至此,明略科技在工业互联网领域的布局也逐渐呈现。
据悉,丁伟庆此前历任施耐德电气(中国)有限公司高级副总裁、诺基亚西门子网络通信公司副总裁、中国移动客户业务总经理、湖南华诺技术有限公司总裁。雷锋网特别采访了丁伟庆,就明略科技在工业互联网领域技术布局及相关发展思路进行了梳理和分析。
基于「224战略」的 工业互联网技术体系
2019年3月27日对于明略科技来说是企业发展的一个关键时间节点,明略科技在这一天正式对外公布,「明略数据」升级为「明略科技集团」,并成立了ESG(Enterprise Service Group,企业服务事业群)、PSG(Public Service Group,公共服务事业群)、NSG(New Service Group,新服务事业群)三大事业群。
据官方信息显示,PSG主要为公共安全、应急管理、工业互联网、数字城市、金融等领域的政府机构和企业,提供从识别、理解、分析、决策到行动的闭环智能建设,构建知识图谱,通过感知和认知的连接,实现传统企业数字化、智能化转型。
“大数据分析和应用、知识图谱、基于多模态人工智能人机协作平台、数据中台,以及数据知识双驱动的推理和推荐引擎,是明略的五大核心技术。”丁伟庆告诉雷锋网。
这样的的技术架构也贯穿了整个工业互联网BU,这主要体现在PSG的「224战略」(2大应用、2大战略市场、4大产品线)上。
针对「224战略」,丁伟庆向雷锋网 (公众号:雷锋网) 解释如下:
“2”大战略市场:
-
第一类,国家安全、智慧治理以及城市管理;
-
第二类,大型组织的高效运转和企业加速创新。
“2”大应用:
-
第一,基于人和组织社会行为动态数据的分析挖掘与智能应用;
-
第二,基于设备和装备物联感知(AIoT)动态数据的分析挖掘与智能应用。
“4”大产品线:
-
第一,数据中台。通过构建数据中台,汇聚治理多源异构数据,盘活数据资产,形成客户全面感知平台;
-
第二,明智系统。基于数据中台,构建行业知识图谱和认知分析模型,形成客户全面认知平台;
-
第三,业务中台。基于数据中台和明智系统,构建客户业务中台,支持客户多种行动智能应用;
-
第四,智能设备。打造服务大AI闭环应用的一体化智能设备,包括边缘计算智能终端、雾计算智能服务器、专用服务器、定制服务器、安全服务器等。
明略科技的“224战略”
聚焦到工业互联网领域,丁伟庆也解释了这一战略的具体打法:
针对工业设备的动态数据,充分采集、汇聚、挖掘、提炼;然后利用知识图谱、人工智能的能力,解决行业运营、建设、生产、管理所遇到的问题,从而通过数字化、网络化、智能化促进整个工业智能化发展。
感知:从数据收集到数据治理
类似于自动驾驶技术发展的阶段划分,明略科技基于数据应用能力,具体将企业智能化转型划分为识别、理解、分析、决策、创新5个阶段。在这5个阶段中,主要强调的则是对数据的感知和认知能力。
针对数据感知能力,明略科技构建了多维感知数据汇聚平台、数据治理管理平台、数据存储、数据共享服务构成的数据中台,这一平台通过采集、爬取、探查、汇聚和解析各种结构化和非结构化数据,实现对数据的融合打通、关联建模。
多源异构的数据包括设备本身运行的数据、传感器收集的数据,以及环境中摄像头上传的视频数据,这些数据分为结构化、非结构化、半结构化数据,明略科技主要对这些数据实现感知。
数据中台架构
工业互联网中的数据与物联网领域数据有所不同,首先是数据量相对不够大,其次是对数据质量有高要求。
“在消费领域,通用大数据构建的深度学习模型是不可解释的,这对要求高可靠的工业来说是不可接受的。”ABB首席技术官刘前进此前就工业大数据曾这样表示。
此前在消费领域盛行的相关关系也可能不再通行,因果关系仍将是很长一段时间工业领域追求的目标。
对此,丁伟庆告诉雷锋网,“面对数据量不够,不足以支撑相关关系的时候,要利用大量先验知识,即此前积累下的知识降低计算模型对数据数量的依赖。把行业知识图谱充分利用起来,可以缓解或一定程度上解决当下工业大数据面临的挑战。”
明略科技的数据感知更多是在讲数据采集、数据治理,无论是结构化数据,还是非结构化数据,当下工业环境中高质量的大数据仍是需解决的第一道难题。针对数据感知,明略也构建了一套数据治理平台和工具。这套数据治理平台主要包括以下三个方面:
-
CONA,结构化通用治理平台。可实现数据接入、数据清洗、数据融合、数据标准化、数据监控和数据管理。能够大规模自动采集、清洗、归类、关联所有结构化数据,形成统一数据视图,提高行业知识图谱构建效率。
-
Raptor,非结构化文本治理产品。一种基于深度学习模型的非结构化文本治理产品,采用深度学习模型和主动学习技术,支持外部NLP模型,可快速、高效地完成数据标注。
通过这两大工具,能够帮助收集、整理、汇聚数据。
-
HARTS,关联知识挖掘产品。基于各行业的基础信息、标签特征、轨迹行 为、交易记录、通联事件、围栏卡口等数据,通过规则引擎、机器学习、图挖掘等多种计算方法,分析、挖掘和推理出多元化对象之间多维度的关联关系,用于行业大脑的知识积累、符号计算和智能推理。
认知:知识图谱构建思路
除去数据采集、数据治理之外,明略科技也在基于大数据和AI技术构建行业知识图谱,即知识图谱数据库蜂巢(NEST)。
明略科技的知识图谱数据库蜂巢,是将机器大脑中的知识库、人工智能应用的基础设施,基于创新性的混合存储技术,向下对接多种形式的结构化/非结构化数据融合为统一的多维度关联知识图谱,向上为业务应用提供基础的图谱查询能力和复杂的图谱分析计算能力。
据悉,蜂巢将所有数据以实体、关系、事件、文档 的形式存储,形成包含二维关联信息、时空信息、历史状态信息、隐性关联信息、非结构化模糊关联多个层次的大知识基础, 结合多元化检索、复杂图谱分析、在线关系挖掘等技术,为业务应用提供了兼具深度和广度的高性能知识服务。
蜂巢核心功能
基于蜂巢,明略科技还构建了可视化知识分析平台SCOPA。该平台支持海量数据图谱的高效存储、分析与挖掘,可以根据业务场景和数据图谱特点,提供关系网络分析、时空轨迹碰撞、实时多维检索、信息比对碰撞、智能协作系统、实时数据接入、智能交互等功能。
知识图谱构建虽然能够降低工业数据模型对大数据的依赖,然而就工业领域数据量不足与知识图谱构建其实在一定程度上存在相互制约关系。工业互联网整体起步较晚,行业领域碎片化严重,使得工业领域知识图谱的构建缺乏数据、缺乏先验知识。
丁伟庆告诉雷锋网,明略科技知识图谱的数据来源主要有两方面:
-
第一,重要的技术、管理人员,在行业所获取的知识、经验和能力后,把这些内容数字化,作为行业知识图谱重要的数据来源之一;
-
第二,管理数据,例如设备运行故障处理的日志等材料,由此积累形成的行业强相关的规则、经验。
明略科技最早入局的是安防领域,因而知识图谱的构建也是从安防领域开始。据丁伟庆介绍,明略科技在公安领域构建的知识图谱已经应用多年。
公安系统主要是利用知识图谱提高整体破案效率。我们在公安系统中的整个知识图谱,把多源异构的数据,例如,人、事、地、物的数据、姓名、身份、出行记录、住宿记录、通信记录等数据结合起来,再根据破案的需求,通过逻辑判断,快速缩小嫌疑犯的范围,在有限的时间内锁定嫌疑犯,从而缩短破案时间。
具体到工业领域的知识图谱的构建,丁伟庆告诉雷锋网,知识图谱在工业领域使用的逻辑是一样的,将诸如维修手册、工人维修经验、网络上关于设备维修的方法的数据进行提炼,形成知识图谱。通过知识图谱对多源异构的数据进行分析提炼,形成针对某一类设备的智能维修知识图谱。“我们针对工业领域部分设备已经有实际客户案例。”
在知识图谱使用过程中,对数据和经验的收集是不断迭代形成的。具体是根据使用过程用户反馈,进行不断调整。
与此同时,丁伟庆特别强调,明略有很多在行业里面浸染多年,对行业的业务、行业的规则都很熟悉的行业专家,这些行业专家不是简单地只知道行业知识,而是本身必须跨界的能力,很强的学习能力,是相对混合型的人才。
明智系统2.0:数据中台、AI中台的技术融合
围绕大数据、AI技术,明略科技分别构建起数据中台和AI中台,基于此,在不同行业可以构建各自的业务中台。与此同时,明略科技构建的明智系统也已经迭代到2.0版本,拥有语音识别、机器视觉、自然语言文本处理、结构化数据治理、规则引擎等技术能力。
明智系统2.0产品体系
2018年9月,明略科技推出明智系统2.0版本。“相较2017年发布的明智系统1.0版本,2.0版本在多源异构数据治理能力、AI分析能力、精确度,以及两个系统之间的协同能力都有所提高。另外,这一版本打通了从感知到认知,再到行动的系统,形成了AI闭环。”
明智系统2.0的产品逻辑是用符号打通感知和认知,构建AI驱动的数据治理平台,并以感知智能技术为基础,构建完整的行业人工智能大脑——蜂巢NEST。
具体而言,
明智系统2.0通过“符号的力量”完成对于行业数据中所蕴含知识的抽取、融合、推理、和沉淀等一系列过程,打通感知智能;
此外,明智系统2.0还强化了认知智能,将多元异构数据通过动态索引及知识分析技术进行充分融合,在此基础上开展逻辑推理及复杂运算。基于语义的分析检索等各类场景应用也可以通过“明察”引擎进行加速完成。
明略科技正是以此支撑起明略科技业务平台,支撑起其行动系统。具体明略科技业务平台架构如下图所示:
明略科技业务平台架构
据明略科技官方信息显示,明略科技深度参与国家发展改革委于2019年批复的增强制造业核心竞争力关键技术产业化项目(即:轨道交通行业的国家级示范工程项目)车辆智能运维系统R.I.S.E平台。
明略科技参与了RISE平台车联网系统的多源异构大数据平台和核心车联网技术系统构建。前者,主要是将车辆实时的传感器数据,非结构化的视频、图片数据,融入平台,作为数据管理的核心支撑整个车辆智能运维系统;后者主要是通过物联网和大数据技术的结合,使用数据网关、行为解析以及实时处理的技术,实现车辆智能运维分析。
据悉,通过已经落地实施的车联网系统,上海申通地铁原来每天要做的日检工作,通过信息化手段,实现每8天一检,大大减轻运维工作量。截至8月底,RISE平台中的车联网系统已在上海申通地铁11条线路的部分车型部署上线。
工业互联网,明略的发展思路
工业互联网,为中国工业企业带来了什么?
目前可见的是,包括国家政策、经济环境、市场需求、企业痛点都在朝着利好工业互联网发展的方向进行。企业升级转型,工业互联网成为必然选择。
“国际上,数字化、网络化到智能化,相对而言是一个串联的进程。在中国,我们不能完全照搬国外的情况,因为中国有很多中小企业数字化做得还不够好。中国企业应该利用中国的后发优势,按照并联的方式,加速智能化进程。”
工业互联网初期,一百个企业有一百个不同的发展思路。明略科技希望通过构建数据中台、AI中台,通过打通感知、认知、行动系统,实现AI闭环落地,这也是明略科技的HAO智能理论。而在这样的道路上,既需要不断有行业高质量数据为其数据中台输血,也需要有AI技术能力为其AI中台提供底层技术能力。
从丁伟庆的介绍中可见,前者,明略科技通过与行业合作伙伴合作、培养行业专家,以及跨功能、组织的多元异构数据共享进行数据汇集、治理和共享;后者,明略科技在2018年7月成立了明略科学院,从事AI基础技术能力的研发工作,为AI中台持续供血。
在这样的技术体系和产品体系下,明略科技已经开始落地工业互联网项目。“明略科技将这套产品应用到工业互联网已有两年,目前明略科技在工业互联网领域布局主要聚焦在交通、电力、制造业三大垂直领域。”
此外,值得注意的是,在8月29日开幕的2019世界人工智能大会上,继BAT,科大讯飞,商汤后,科技部再次公布国家新一代人工智能开放创新平台,明略科技也名列其中。
尽管如此,就当下国内工业发展现状而言,要构建起工业领域完整的知识图谱,要实现丁伟庆口中的以并联方式跨过工业数字化进程,进入智能化时代,显然还有很多问题要解决,还有很长的路要走。
。