科技猎
立即注册,自主定制私人频道
深度强化学习
本页是关于频道"深度强化学习"的所有博文,按照时间倒序展现。实时更新。
总数
54
第
1/6
页
伯克利具身智能图谱:深度强化学习浪尖上的中国 90 后们
雷锋网
•
10天前
作者 | 赖文昕编辑 | 陈彩娴短短不到一年内,边塞科技、星动纪元、星海图和千寻智能接连成立,跻身国内明星创企之列;大洋彼岸,Covariant 和 Anyware Robotics 也正在湾区闪耀。六家具身智能公司,八位 90 后创始人,他们都成长于深度强化学习的摇篮。作为最早一批开启新范式的人,他们探索 AI 和
「反卷斗士」许华哲:以热爱为名,用深度强化学习打造一个「机器厨子」
雷锋网
•
2年前
十年前,他以本科生的身份走入清华电子系;十年后,他将以一名教师的身份重回清华,在叉院开启新的篇章,传递知识,探索真理。作者 | 李梅编辑 | 陈彩娴想象一下:在未来的某一天,你,一个996的「社畜」,或「上班狗」,辛苦一天回到家,瘫倒在沙发上。当你抬头一看,你的机器人朋友正在厨房为你做晚饭——它的双手敏捷灵活,在油盐酱
DeepMind用深度强化学习研究“人造太阳”!据说这是秘密进行了3年的工作
雷锋网
•
2年前
“AI+物理”成功破圈,DeepMind 怕是要上天。作者 | 王晔编辑 | 陈彩娴北京时间凌晨四点,DeepMind在官方推特上发布消息,称其与瑞士洛桑联邦理工学院(EPFL)合作研究出第一个可以在托卡马克(Tokamak)装置内保持核聚变等离子体稳定的深度强化学习系统,为推进核聚变研究开辟了新途径,工作已发表在Na
什么是深度强化学习?
虎嗅网
•
2年前
在 上一支视频中 我们提到过,强化学习中的主体会依据环境采取行动,使用神经网络构建强化学习主体的方法,就是深度强化学习。 游戏、机械臂、自动驾驶,强化学习面对的情景多种多样,环境、行为、回报很难穷尽。但只要有输入就一定会有输出,神经网络面对没有见过的情况也能做出选择,这就是我们使用深度强
汪昭然:构建“元宇宙”和理论基础,让深度强化学习从虚拟走进现实
雷锋网
•
3年前
作者 | 陈彩娴深度强化学习的故事,可以追溯到2015年:当时,位于英国伦敦的一家小公司 DeepMind 在《Nature》上发表了一篇文章“Human-level control through deep reinforcement learning”,提出了一种新算法叫Deep Q-Network(简称“DQN”
开源巨献:27个深度强化学习算法的实例项目
雷锋网
•
4年前
译者:AI研习社( 宋怡然 ) 双语原文链接: Deep Reinforcement Learning Nanodegree Algorithms 在这里,您可以找到几个致力于“深度强化学习”方法的项目。 项目以矩阵形式部署:[env x model
谷歌、帝国理工、剑桥新神级合作: 让AI向动物学习!深度强化学习新方向
IT思维
•
4年前
公众号/将门创投From: Venture Beat; 编译: Shelly 对 人工智能 的智力探索从没有间断。这一回,帝国理工学院和剑桥大学首次把目光转向了动物,并开创性地提出:AI可以从动物身上学习常识! 动物认知更易于理解,是非语言的智能行为。探索动物的认知能力,不仅能训练智能体,
深度强化学习 继续死磕电子游戏还是另辟蹊径?
网易科技
•
4年前
(原标题:深度强化学习走入「死胡同」,继续死磕电子游戏还是另辟蹊径?) 2019年,深度强化学习可以算得上 AI 研究的 Top 关键词之一。无论是 DeepMind 星际2 AI 「AlphaStar」血虐人类玩家,还是 OpenAI 最终因太过强大而被认为可能有风险所以不公开发布的语言模型 GP
深度强化学习走入「死胡同」,继续死磕电子游戏还是另辟蹊径?
雷锋网
•
4年前
2019 年,深度强化学习可以算得上 AI 研究的 Top 关键词之一。 无论是 DeepMind 星际2 AI 「AlphaStar」血虐人类玩家,还是 OpenAI 最终因太过强大而被认为可能有风险所以不公开发布的语言模型 GPT-2,无疑都在过去一年中最轰动的 AI 大事件之列,也吸引了 AI
【新课预告】加州大学伯克利分校CS285《深度强化学习》学习小组成员招募
雷锋网
•
5年前
语音播放文章内容由深声科技提供技术支持 您的浏览器不支持 audio 元素。 他来了他来了,字幕君带着新课的授权来了! 在这2019年的尾声,字幕君带着获得了 加州大学伯克利分校 CS285 《深度强化学习》 讲师@Sergey Levine正
提交建议
微信扫一扫,分享给好友吧。