近年来,世界模型(World Model)在机器人、模拟与强化学习中均取得了出色的研究结果。
2018年,Jürgen Schmidhuber 与 David Ha 首次以无监督的方式训练世界模型,使模型能快速学习环境中的压缩时空表征,再将世界模型中的特征作为智能体的输入,训练出了一个非常压缩与简单的
全球人工智能精选日报(2016/06/28)1、微软研究院基于LSTM的人机交互模型微软研究院的研究人员发表一篇论文《End-to-end LSTM-based dialog control optimized with supervised and reinforcement learning》。该论文介绍了一种面向