聊天机器人为什么需要进行深度学习?
编者按:本文作者 Sergei Burkov 是俄罗斯莫斯科物理技术学院博士,也是旅游推荐智能机器人公司 Alterra.ai 创始人兼首席执行官。
聊天机器人现在非常热门,但是当我们谈到“聊天机器人”时,会发现它有两个完全不同的类型:一种是配置对话用户界面的智能虚拟助手,另一种,则是依赖屏幕按键图像用户界面的非智能菜单驱动的程序。相比于前者,以菜单驱动的聊天程序的确拥有不少劣势,用户接受度也不高,比如他们无法支持深度链接、创新性较低、同时也缺乏内部机器人之间的“bot-to-bot”通讯协议。相反,智能聊天助手则为上述问题带来了解决方案,它们无需新协议或应用程序接口就能实现彼此间的通讯,而且也不依赖于类似于 Google Assistant 这样的“主机器人”。更重要的是,人们用自然语言就能与之交互。
机器人要用自然语言实现交互
过去,每家公司都需要有一个官方网站,以后他们都需要一个专属的会话式机器人。但是在绝大多数情况下,你不会直接与它们对话,用户可能会首先与一个“主机器人”进行交互,比如谷歌的 Google Assistant、三星的 Viv、以及亚马逊的 Alexa。主机器人会判断哪一个“下属”机器人有能力处理你的请求,再把你的请求转发给它们。
举个例子,假如你想要在巴黎预定一个酒店,你只需说:
谷歌,我下周日想去巴黎,请帮我预订一个每晚不超过 200 美元的四星级酒店,里面要有免费的 Wi-Fi 和健身房服务,还有,我要住五天。
此时,Google Assistant 会找到一个旅行代理服务机器人(比如 Expedia、Booking.com、或是 Alterrra 等),然后把这个请求转发过去,如果“接收方机器人”足够智能,能够理解用户请求,那么就能完成一笔酒店预订业务。
关键是,“主机器人”和“接收方机器人”之间也能够使用自然语言彼此交流。再比如,当你和全球私人旅行指南出版商《Lonely Planet》旗下的聊天机器人对话,想问问它阿姆斯特丹有哪些著名的旅游景点,你只需问说:
下周二阿姆斯特丹的天气怎么样啊?
此时《Lonely Planet》机器人会把你的请求转发给 Weather.com 机器人,如果后者有能力回答这种自然语言问题,那么就会把答案传递过来。换句话说,英语将变成未来机器人彼此之前的“通讯协议”。
聊天机器人会变成另一个“亚马逊土耳其机器人”吗?
看上去,人工智能技术对聊天机器人非常有帮助。但可能也不一定,因为我们还有另外一个选择:由人工支持的聊天代理服务,比如亚马逊的土耳其机器人模型。事实上,现在不少初创公司已经采用了这种方式,但它却是一个死胡同。
为什么这么说呢?其实还是人类本身的问题——无法实现规模化拓展,速度也太慢,成本更是无比昂贵。而且我们没有足够多的人力,来支持数以百万计的机器人服务世界上每家公司。人类愿意回到手工劳动力时代吗?想象一下,假如亚马逊每笔交易都是通过现场销售人员来为客户提供服务,他们能够承受得了吗?所以结果很明显,企业未来只能选择人工智能,否则距离破产就不远了。
传统的自然语言处理技术还能发挥作用吗?
自然语言处理算法有两大类:传统自然语言处理和深度学习。
传统自然语言处理涉及大量编码。你必须要预测用户在每个场景下可能会说的词汇和短语、识别说话类型、再提取预定义的关键词,等等。换句话说,传统自然语言处理有很多规则,很多正则表达式,以及大量的硬编码。所以,你需要花费大量时间写代码,调试程序bug。但是,一旦用户在对话时偏离了预期路径,之前所设定的规则就很容易会被打破,这就是为什么许多机器人让人感到非常愚蠢的原因。
我们不得不构建大量智能虚拟助手,让它们去维护自然语言对话。那么问题是,我们能够用传统自然语言处理来实现这个功能吗?貌似看上去不太可能——毕竟难度太大,而且也十分耗时。更重要的是,地球上可能没有那么多程序员来写代码。
依靠深度学习来解决聊天机器人的瓶颈问题
幸运的是,现在我们有一个替代方案,这个技术给人们带来了希望,它就是深度学习!相比于特别编写一个明确的规则,现在我们只需要构建一个人工神经网络,然后给它提供培训语言。
然而,构建人工神经网络并不简单,你需要把不同的算法和解决方案缝接在一起。好的一面是,当你完成的时候所有工作后,会得到一个可以理解自然语言的神奇机器。如果你注意到它出现了某些错误,完全不需要编写新代码来解决问题——只需给它提供更多学习样本就可以了。而且,你也不需要重新给“机器人大脑”编程,当你有了这样一种机器,会发现团队的工作效率大幅提升,过去需要花费数年时间才能完成的产品,现在即便人手不足也能快速推出。
不幸的是,我们现在还没有这样神奇的机器,然而很多公司都正在朝这个方向努力。现在几乎所有的聊天机器人设计框架都是基于自然语言处理的软件开发包,而不是深度学习技术。换句话说,如今的聊天机器人依然类似于传统的劳动密集型服务行业,但是随着深度学习技术的不断发展,我们应该很快就能看到隧道尽头的曙光了!