深度强化学习

本页是关于频道"深度强化学习"的所有博文，按照时间倒序展现。实时更新。

总数 54 第 1/6 页

伯克利具身智能图谱：深度强化学习浪尖上的中国 90 后们

雷锋网 • 4月前

作者 | 赖文昕编辑 | 陈彩娴短短不到一年内，边塞科技、星动纪元、星海图和千寻智能接连成立，跻身国内明星创企之列；大洋彼岸，Covariant 和 Anyware Robotics 也正在湾区闪耀。六家具身智能公司，八位 90 后创始人，他们都成长于深度强化学习的摇篮。作为最早一批开启新范式的人，他们探索 AI 和

「反卷斗士」许华哲：以热爱为名，用深度强化学习打造一个「机器厨子」

雷锋网 • 2年前

十年前，他以本科生的身份走入清华电子系；十年后，他将以一名教师的身份重回清华，在叉院开启新的篇章，传递知识，探索真理。作者 | 李梅编辑 | 陈彩娴想象一下：在未来的某一天，你，一个996的「社畜」，或「上班狗」，辛苦一天回到家，瘫倒在沙发上。当你抬头一看，你的机器人朋友正在厨房为你做晚饭——它的双手敏捷灵活，在油盐酱

DeepMind用深度强化学习研究“人造太阳”！据说这是秘密进行了3年的工作

雷锋网 • 3年前

“AI+物理”成功破圈，DeepMind 怕是要上天。作者 | 王晔编辑 | 陈彩娴北京时间凌晨四点，DeepMind在官方推特上发布消息，称其与瑞士洛桑联邦理工学院（EPFL）合作研究出第一个可以在托卡马克（Tokamak）装置内保持核聚变等离子体稳定的深度强化学习系统，为推进核聚变研究开辟了新途径，工作已发表在Na

什么是深度强化学习？

虎嗅网 • 3年前

在上一支视频中我们提到过，强化学习中的主体会依据环境采取行动，使用神经网络构建强化学习主体的方法，就是深度强化学习。游戏、机械臂、自动驾驶，强化学习面对的情景多种多样，环境、行为、回报很难穷尽。但只要有输入就一定会有输出，神经网络面对没有见过的情况也能做出选择，这就是我们使用深度强

汪昭然：构建“元宇宙”和理论基础，让深度强化学习从虚拟走进现实

雷锋网 • 3年前

作者 | 陈彩娴深度强化学习的故事，可以追溯到2015年：当时，位于英国伦敦的一家小公司 DeepMind 在《Nature》上发表了一篇文章“Human-level control through deep reinforcement learning”，提出了一种新算法叫Deep Q-Network（简称“DQN”

开源巨献：27个深度强化学习算法的实例项目

雷锋网 • 4年前

译者：AI研习社（宋怡然）双语原文链接： Deep Reinforcement Learning Nanodegree Algorithms 在这里，您可以找到几个致力于“深度强化学习”方法的项目。项目以矩阵形式部署：[env x model

谷歌、帝国理工、剑桥新神级合作: 让AI向动物学习！深度强化学习新方向

IT思维 • 4年前

公众号/将门创投From: Venture Beat; 编译: Shelly 对人工智能的智力探索从没有间断。这一回，帝国理工学院和剑桥大学首次把目光转向了动物，并开创性地提出：AI可以从动物身上学习常识！动物认知更易于理解，是非语言的智能行为。探索动物的认知能力，不仅能训练智能体，

深度强化学习继续死磕电子游戏还是另辟蹊径？

网易科技 • 5年前

（原标题：深度强化学习走入「死胡同」，继续死磕电子游戏还是另辟蹊径？） 2019年，深度强化学习可以算得上 AI 研究的 Top 关键词之一。无论是 DeepMind 星际2 AI 「AlphaStar」血虐人类玩家，还是 OpenAI 最终因太过强大而被认为可能有风险所以不公开发布的语言模型 GP

深度强化学习走入「死胡同」，继续死磕电子游戏还是另辟蹊径？

雷锋网 • 5年前

2019 年，深度强化学习可以算得上 AI 研究的 Top 关键词之一。无论是 DeepMind 星际2 AI 「AlphaStar」血虐人类玩家，还是 OpenAI 最终因太过强大而被认为可能有风险所以不公开发布的语言模型 GPT-2，无疑都在过去一年中最轰动的 AI 大事件之列，也吸引了 AI

【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募

雷锋网 • 5年前

语音播放文章内容由深声科技提供技术支持您的浏览器不支持 audio 元素。他来了他来了，字幕君带着新课的授权来了！在这2019年的尾声，字幕君带着获得了加州大学伯克利分校 CS285 《深度强化学习》讲师@Sergey Levine正