什么是深度强化学习? 虎嗅网 • 2年前 扫码分享 我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。 在 上一支视频中 我们提到过,强化学习中的主体会依据环境采取行动,使用神经网络构建强化学习主体的方法,就是深度强化学习。 游戏、机械臂、自动驾驶,强化学习面对的情景多种多样,环境、行为、回报很难穷尽。但只要有输入就一定会有输出,神经网络面对没有见过的情况也能做出选择,这就是我们使用深度强化学习的原因。 随意打赏