像调教小狗一样,调教机器人做家务
今年8月,雷锋网将在深圳举办一场盛况空前有全球影响力的人工智能与机器人创新大会。届时雷锋网 (搜索“雷锋网”公众号关注) 将发布“人工智能&机器人Top25创新企业榜”榜单。目前,我们正在拜访人工智能、机器人领域的相关公司,从中筛选最终入选榜单的公司名单。
如果你也想加入我们的榜单之中,请联系:2020@leiphone.com。
训练机器狗的虚拟环境。图片来源: 华盛顿州立大学 。
华盛顿州立大学的研究人员正在使用训练动物的想法,帮助非专业用户训练机器人如何执行预期任务。
当机器人在社会中越来越普遍,人类开始希望它们能做一些家务琐事,比如打扫房间,做饭,等等。不过,对于那些没有编程经验的人来说,让机器人开始执行一个任务,必须给予一定的指引说明。“所以,我们需要为普通人提供一种训练机器人的方式,无需编程就能做到。”Matthew Taylor说道,他是华盛顿州立大学电子工程与计算机科学学院教授。
Bei Peng是布朗大学和北卡罗莱纳州立大学计算机科学专业博士生兼项目协作员。 在他的帮助下,Taylor在华盛顿州立大学智能机器人学习实验室设计了一款计算机程序,即便用户没有任何计算机编程专业知识也可以教会虚拟机器人学习任务,这个虚拟机器人位于华盛顿州立大学的智能机器人学习实验室,是一只虚拟小狗。
为了进行学术研究,研究人员改变了虚拟狗的反应速度。当人们训练真正的动物学习某项新技能时,相对较慢的运动能让训练人员知道,虚拟狗是否理解该如何做出行为反应,这样训练人员才能提供更清晰的指导,帮助机器人更好的学习。
研究人员已经开始在实体机器人和虚拟机器人上做实验,最终,他们希望使用这款程序帮助人们成为一个高效率的动物训练员。
在最近举办的国际自动代理与多代理系统会议(注:international Autonomous Agents and Multiagent Systems conference,该大会是一个汇聚机器人代理服务商和机器人研究的科学大会)上,研究人员展示了他们的工作成绩。此外,该项目还获得了美国国家科学基金会的资金支持。
当机器人在人类世界里变得越来越常见,让那些没有编程经验的用户训练机器人学习新技能,就变得尤为重要。在现有的交互强化学习技术(Interactive Reinforcement Learning)里,绝大多数只专注于解释或整合非专业的人类反馈,以此加速机器人的学习速度;我们的目标,是给学习代理器程序设计一个更好的表现,让这个程序能在人类训练者和学习者之间引出更多自然且高效的交流。而人类反馈离散的通讯信息,概率上取决于训练者的定位策略概率。这项工作需要一个用户研究,通过在不同模拟环境下给予的不同奖励和/或惩罚,参与者训练一个虚拟代理器程序去完成各种任务。我们的研究成果来自于60个参与者,展示了学习者可以学习自然语言命令,并适应其行为执行速度,以此更高效地从人类训练者那里学习。这个代理器程序的行为执行速度可以成功被调整,继而鼓励从人类训练者那里获得更多明确的反馈(特别是在一些高度不确定的状态领域里)。我们的研究结果表明,我们创新的自适应速度代理器程序在一些性能评估上优于那些固定速度代理器程序。此外,我们还研究了在训练条件下,指令对用户性能和用户偏好的影响。
via Kurzweilai