百分点苏萌博士:是时候“冷思考”AI了
希望以更冷静的思考、从客观的角度来评估人工智能目前的发展现状和问题。
创业家 & i黑马 讯(张晋宁)7月6日消息,由创业黑马主办的“2018中国独角兽峰会”今日在京举行,百分点董事长兼CEO苏萌博士出席活动并发表主题演讲。
苏萌在演讲中表示,人工智能在过去经历了几年的起伏,今天到了该深度思考的时间点了。同时,他希望能冷静思考和从更客观的角度来评估人工智能目前发展的现状和遇到的问题。
谈及人工智能进化的进程,苏萌博士认为,其可以被概括为“人工智能进化三部曲”:感知,认知和决策。
以下为经i黑马编辑过的演讲节选:
人工智能经过过去几年多次的起伏,到今天到了需要深度思考的一个时间点了。所以,今天想和大家分享一下百分点过去几年在人工智能实践中所经历过的困难、取得的成绩,以及未来的目标和方向。
之所以叫做“对AI冷观察”,是因为希望以更冷静的思考、从客观的角度来评估人工智能目前的发展现状和问题。
百分点 苏萌
人工智能演进方向的两大核心要素
大家知道,人工智能主要包括三个部分:数据、算力、算法。目前来说,深度学习算法已经逐渐从无所不能的神坛走下,它的一些问题也逐渐显现:
1、数据来源的挑战。需要非常非常多数据,才能让它做深度学习。
2、过程不可见。深度学习如同放进了黑盒子。
3、结果很难进行举一反三。
我认为人工智能在未来的演进方向主要是机器的理解能力。
大家知道,科学上有两种推理方法,目前来看机器的逻辑推理和判断能力远远达不到人类的60%,很多知识不能连贯起来,大多数的机器可以做计算和存储,但是它的理解能力非常差:比如一篇文章的第一段和最后一段,人类很容易把它串联起来,但是换做机器就会变得很困难。并且机器又缺少像人类一样的基本常识,尽管有人提出可以建一些常识库,但是目前为止,常识库的建立是非常困难的。
另一个演进方向,是人工智能在解决具体业务问题能力。目前来看,整个人工智能产业只是将其解决问题的能力进行一点一点地推进,远不像大家想象的那么容易或那么快速。
人工智能进化三部曲
基于百分点在服务过上万家的企业基础上,发现人工智能在不停地进化,可以把它分成三部曲:
1、感知。
感知层指的是机器的听觉、视觉。想让机器像人类一样能够听懂,能够看到,并能够通过传感器感知到。百分点所做的就是在物理的现实世界里能够镜像出一个数字世界,在这个数字世界让机器能够了解、映射现实世界。可以看到,目前在人脸识别、语音识别技术已经相对成熟,已经涌现出来非常多的优秀企业。
2、认知。
但今天我更想强调的是认知层突破的重要性。
认知智能,它需要让机器能够去理解、去判断,包括自然语言处理、语义分析、知识图谱,以及逻辑推理等技术,最终让机器像人一样去认知,这也是让AI具有理解能力的核心。相对感知层,认知层变得异常复杂。让机器形成一些知识、建立知识图谱、实现人机交互,以及把知识进行输出等,在这个过程中要做大量的知识计算,这件事情是异常困难。
认知层的另一个技术是知识图谱。通过建立知识库,将知识和业务结合起来再进行知识的输出,得以让人类更方便地获取知识上的认知,因而被称为人工智能的基石。
3、决策。
百分点认为,人工智能终极智能是决策的智能,需要能够帮助人类去解决问题、做决策。目前很多独角兽企业服务2C,与此同时,还有非常非常多的业务需求是来自于企业、政府的需求。企业和政府有大量决策需要,在沉淀了大量的数据后,需要借助机器智能让决策变得更加智能、自动化和自适应。
百分点的认知层突破
百分点在人工智能领域更专注于认知层。首先在自然语言处理方面,已经服务众多客户,覆盖媒体出版行业的新华社、新华网、中国日报、南方报业在内的国家级、省级主流媒体,人民出版社、电子工业出版社、中国科技出版社、大百科全书出版社等多家有影响力的综合、专业出版社,以及广电总局、江苏广电荔枝台等机构,同时也包括金融企业和制造业。
目前百分点自然语言处理,在分词和实体识别等一些重要指标,例如分词识别准确度已经达到99%、实体识别准确度达到93%,已经达到国内顶尖水平。并且它的应用的场景非常广泛,比如说智能审核、智能采编、文本的自动生成、知识图谱,以及人际交互方面的智能问答。
我认为,除了让机器去处理这些自然语音,还需要让机器将自然语音和知识构建出知识图谱,让知识以网状和竖状的结构对外输出,实现和人、组织进行交互。目前,百分点在媒体出版、公共安全、金融、电商等行业都构建了对应的知识图谱,构建出了行业最大的行业知识图谱库,实体数达到数千万的量级,关系数达到几十亿的量级,但还需要建立大量的关系让机器去理解人类、理解世界。
实际上,百分点主要做的事情,就是为实现未来智能的决策系统,让机器像人类一样去认知这个世界,像人类一样可以做逻辑推理和判断、决策。
百分点在已于去年发布了行业首款智能决策系统DeepMatrix,未来还会通过不停地迭代,来让行业更容易地基于已有的数据做智能分析和决策。
百分点如何进行AI落地?
目前,百分点已经拥有众多的AI落地案例。以下三个场景从公共安全智能感知平台、智检问答系统以及自然语音生成三个领域应用了百分点的技术产品。
首先是在今年6月份上合组织青岛峰会上,百分点参与了上合组织态势感知平台的搭建。百分点公安大数据技术和产品为峰会重点枢纽区域的警务部门,提供大数据挖掘分析技术和智能安全分析平台。上合组织是一次高规格、大规模的峰会,公安有大量数据,经侦、刑侦、网侦等数据,需要有处理多元异构的海量实时数据的能力,并能够对重点事件来做出预警和预判,百分点依托“动态知识图谱”技术,对当地近百类数据资源、几十亿条数据,以及每天新增千万条数据进行动态融合,对潜在风险隐患的智能识别和主动预测、预警、预防,以AI构建新型社会治安防控网络,保障“上合峰会”,
第二件事情是我们最近在帮助检察院来做的全国首款智能检务问答系统。我们认为,通用的人工智能领域,离智能问答其实还很远,无论是做常识知识库还是做行业知识库都进展缓慢。因此,百分点选择一个具体的领域,把该领域的知识真正形成知识图谱来做对外输出。
过去半年,百分点成为了全国第一家和检察院系统来做合作的企业,对50万+法律知识的深度学习,基于机器人的语音识别、语义解析和图文识别技术,准确获取用户意图,提供自然、正确、精准化的法律知识智能问答服务。通过用户的语音和文字,机器自动回答其想要了解的关于检务系统的问题。试想,如果没有专业领域的知识,即使是打电话沟通都未必能把问题说清楚。百分点通过将其打造为一套自动问答系统,来帮助更多的市民提供服务。
自然语音生成分成三个领域:一是机器翻译,将不同语音翻译成其他语音,这是最基础的生成;二是自动问答,如常见的语音助理Siri、微软小冰。但是,我们发现自动问答系统做得还不够好,这是因为让机器去了解通识性的知识和逻辑推理非常难。
因此,我们只能在具体的某个领域让机器能够理解的行业知识并形成行业知识库,构建知识图谱,最终形成其对外的知识输出。
第三个案例是百分点联合人民日报推出的AI李白智能作诗词系统。这是百分点第一款的NLG试验,从NLP(自然语音的理解处理)到NLG(自然语音的生成),是百分点往前迈的一小步。自然语言生成的困难之处在于,除了让机器能够智能翻译和智能问答,还要让机器人帮助人类做辅助的创作和写作,比如让机器帮人类写作诗词、歌赋,让机器帮写作法律文书、写作新闻稿,等等。
百分点通过让机器学习80万首古典诗词,推出了中国首个智能写诗系统。今年4月,在首届数字中国建设峰会中进行了展览,连续三天登上了央视。并邀请《中国诗词大会》的冠军得主雷海为先生与AI李白现场斗诗。机器所创作的诗词虽然不能跟李白、杜甫这样几千年沉淀的中国古典文化的瑰宝相比,但是比一般人做的诗更好,最重要的是比人作诗更快。
比如在此次斗诗中,雷海为先生用6分钟写了一首诗花;而百分点的AI李白花了不到1秒,说明AI作诗效率和质量实现了大幅的提升。
最后想和大家分享的是,人工智能可能远不如我们想象的那样能够迅速地给人类带来巨大利益。但是,它的未来是我们都在期盼的。我们人类未来所有的决策将不可避免地依赖更多的机器智能,我们希望,在人工智能发展的路上能够让更多的企业和政府做出更智能的决策,能够让这个社会发展的更快,谢谢大家!