百度技术委员会主席吴华:小度机器人背后的技术
雷锋网按:9月8日。二十国(G20)智慧创新论坛在深圳召开,大会共设置了人工智能、大数据、精准医疗在内的13个板块。
其中在人机交互的板块里,百度的"小度机器人”和Hanson Robotics的“Han”同台,展示人工智能领域自然语言处理技术的现阶段水平。
雷锋网 (公众号:雷锋网) 整理发现,小度机器人诞生于2014年,2014年9月16日江苏卫视的芝麻开门首次亮相。小度机器人集成自然语言处理、对话系统、语音视觉等技术,能与用户进行信息、服务、情感等方面的交流服务。另一个同台对话机器人“Han”是表情机器人Hanson Robotics的作品,“Han”是仿生机器人,其皮肤是使用仿生皮材料制成,有着人类外形以及能够模仿人类的表情。在现场当中“Han”做出的生气、开心、沮丧、思考、惊恐五个表情,与人类相仿。在“Han”和小度机器人的交互中,小度探测出了“Han”的活体程度非常低。
其中百度技术委员会主席吴华也主席了本次活动,并发表主题为自然语言处理技术和应用的演讲,介绍了小度机器人背后的技术,雷锋网在不改变原意的基础上进行编辑。
以下为吴华的演讲实录:
大家好,小度体现了能听、能看、能说、能动等能力,其实背后是百度人工智能在支撑小度,比如说语音技术、视觉技术和自然语言技术。能使机器和人用自然语言进行交互,一直是人工智能的梦想。要实现这一梦想,自然语言处理技术是非常关键的。所以今天我汇报的主题是“自然语言处理技术和应用”。
我们知道自然语言处理技术是为了实现人和计算机或者机器之间,通过自然语言沟通,这里面主要包含语言理解和语言生成。在这基础上,我们可以支撑三大应用系统,比如说机器翻译、问答系统以及对话系统。
首先,我们来看一下自然语言处理技术的发展里程碑,自然语言处理技术主要有三个发展期:萌芽期、发展期以及繁荣期。自然语言处理技术发展的历史,就是一部机器翻译的发展史,1947年,在发布了机器翻译备忘录之后,提出了基于规则、实例和统计的方法。近年也提出了基于神经网络的机器翻译系统,而这些技术的发展促进了机器翻译质量的提高,也加速了机器翻译的商业进程,比如说应用于电子商务、多语言翻译等。同时,在萌芽期发布了神经语言理论,这个理论奠定了在自然语言处理领域的地位。接着是发展期,首次出现了人机对话系统,在这基础上,我们有很多规则方法应用于自然语言处理各个领域。最后是繁荣期,统计方法是重要的主流方法,同时在这个时期,有两个跨时代的技术突破。2011年,IBM的Watson问答技术首次超过人类得到冠军。2014年,在图灵测试的大会上,有聊天程序利用人工智能,通过了图灵测试。所有技术的发展都离不开大数据的获得,尤其是在互联网发达的时代。近年来,人工智能技术进一步发展,也推进了自然语言技术进程。
比如,今年发布的新一代的人工智能规划,自然语言处理被列为关键的共性技术。同时在百度的人工智能布局中,自然语言处理也是关键的认知技术。现在的人工智能创业公司,特别是美国的创业公司,自然语言领域的创业公司排在首位。在中国的人工智能创业公司中,自然语言这个领域排在第三位,仅次于视觉和智能机器人。
这些创业领域包括人机对话,有智能创作、智能客服、舆情分析、内容分析、机器翻译等等。而这些应用的背后,都离不开技术的发展,尤其是大数据和知识获取越来越容易。同时,机器学习的进展,特别是深度学习的进展,也促进了自然语言的发展,这三者相辅相成,就促进了自然语言技术的商业进程。
我们可以通过机器翻译进程看出,统计机器翻译在1995年提出,经过了15年的发展,才出现了第一个大规模的互联网翻译系统。但是在神经网络机器翻译的方法提出之后,一年就出现了大规模的神经网络翻译系统,之后各个大公司都发布了神经网络翻译系统。这个翻译系统质量的提升,也促进了自然语言技术的发展。尽管这个自然语言技术得到了发展,但是,我们的目标是希望让机器像人一样思考。
在这个过程中,我们做了哪些努力?比如说我们在智能交互、智能创作以及智能推进中,推荐应用中,自然语言处理技术都起到了举足轻重的作用。首先我们来介绍智能交互,比如在百度、Google、微软、Facebook都发布了智能助手,或者是聊天的程序,其实最终目标都是为实现人和机器之间的交互。同时这种交互的承载装置也发生了变化,比如说亚马逊的Echo音箱,还有机器人的形式。应用领域或者应用场景也发生了变化,可以在车载中,在汽车中,在家里,在公共领域。就像我们刚才看到的小度机器人,它现在在百度的大厅里面服务,可以查询信息,以及跟百度办公室相关的路线、班车等等信息。
为了实现这样的人机交互,百度也发布了让开发者更容易入门的交互平台Unit。这个平台面向具体任务,面向开发者,开发者只要做少量的工作,就可以定制任务。在这平台中,我们集成了多引擎驱动的语义理解技术。也就是说,利用这个技术,我们可以实现快速的迭代,持续学习。
百度Unit已经可以应用于各种应用中,比如家具,在电视盒子里面,可以通过语音去交互,查找你想要的节目,只要动口,不用动手。还有就是帮助考生查询他填报的高考志愿。还可以应用于智能客服、地图、语音导航,语音路线查询等。除了和机器进行对话,我们也希望机器能够像人一样创作,可以写作、做诗等。
除了写诗以外,我们希望机器人也可以写文章。机器人通过各种规划,主题触发、句子的凝练相结合才能完成写作。比如在写文章之前,需要基于用户感兴趣的文章并构建热点,然后完成脉络梳理以及文章的生成,最后发布在百家号。
除了写诗和写文章以及对话,我们也希望能实现人工智能推荐。我们的主要目标是实现“即搜即得”,搜索是主动行为,而智能推荐是一个被动行为,我们希望用户能够从浩瀚资源的过程当中得到有价值的内容。而要实现个性化推荐,就要在用户兴趣和信息之间建立桥梁,而这个桥梁是我们所说的标签图谱,给用户和文档上同样的标签。举个简单的事例,在这个标签(系统)里面我们有主题标签,有话题标签,有事例标签等,这些标签之间建成了一个网络,其之间有关联,关联的强度都是自动从文档的挖掘或者用户行为中挖掘才获得这样关联的强度。这些关联的强度我们会用在智能推荐以及个性化推荐,在话题的聚合以及关联推荐中,形成百度的首页,通过手机百度首页可以看到,底下的文章都是通过这样的方式来推荐的。
这些自然语言处理的技术已经发布在百度的人工智能平台上,大家可以通过百度的网站获取,网站包括自然语言处理技术、语音技术、视觉技术、用户画像等60多种人工智能的技术,百度希望大家跟各个合作伙伴能共同举起人工智能的大旗,造福人类生活。
。