角色扮演如何教会AI去“命令”和“说服”
语言是人类最基本的交际工具,人类社会的运行和发展离不开语言。我们通过语言来进行的人际互动、交换信息。说话者发出“语言信息”,受话者接受信息并在大脑中经过处理,最后“反馈信息”。那么,这种能力是否能运用于人工智能呢?是否可以让机器人也学会根据自己的需要发出命令指导对方实践?
研究员们通过实践,在一个基于文本的冒险 游戏 中结合自然语言处理和强化学习技术,向机器展示如何使用语言作为工具。一个通过与角色对话完成文本冒险游戏任务的人工智能不仅学会了如何做事,还学会了如何让别人做事。该系统向机器使用语言实现目标迈出了一步。
为了构建一个有目的言语的人工智能,来自亚特兰大佐治亚理工学院(Georgia Institute of Technology)和Facebook人工智能研究中心(Facebook AI Research)的研究人员结合了来自自然语言处理(natural-language processing)和强化学习(reinforcement learning)的技术。
为了测试他们的方法,研究人员在一款名为LIGHT的基于文本的多人游戏中训练他们的系统。LIGHT是Facebook去年开发的,用于研究人类和人工智能玩家之间的交流。游戏设定在一个幻想主题的世界里,有成千上万的众包对象、角色和地点,通过屏幕上的文字进行描述和交互。玩家(人或电脑)通过输入诸如“拥抱向导”、“打龙”或“摘掉帽子”等命令来行动。他们还可以和聊天机器人控制的角色交谈。
为了给出人工智能做事情的理由,研究人员增加了大约7500个众包任务,这并不包括在最初版本的《光》中。最后,他们还创建了一个知识图(一个主题-动词-对象关系的数据库),为AI提供关于游戏世界和游戏角色之间联系的常识信息,比如商家只有在警卫是朋友的情况下才会信任他们。游戏现在有动作(比如“上山”和“吃掉骑士”)来完成任务(比如“建立龙所能获得的最大的宝藏”)。
将所有这些结合在一起,他们训练人工智能仅仅通过语言来完成任务。要执行动作,它可以为该动作键入命令,也可以通过与其他字符对话来达到相同的目的。例如,如果人工智能需要一把剑,它可以选择偷一把或说服另一个角色交出一把。
目前,这个系统还只是个玩具。它的态度可能很直率,但将自然语言处理与强化学习相结合是一个令人兴奋的操作,它不仅可以使聊天机器人更智能地对话,而且可以帮助我们对“充满语言的世界是如何运作的”这一思考进行更丰富且深入地理解。