谷歌机器人利用卷积神经网络，学习利用策略抓取物品

百度百家 • 9年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

谷歌的研究人员们正在尝试帮助机器人产生和人类一般的感知世界的能力，当然这意味着相当多的练习。科学研究员Sergey Levine和他的团队让14只机械手臂彼此网络互联，并利用卷积神经网络来让这些机器人自主学会怎样捡起杯子、胶带座、海豚这样的小东西。

大多数一岁大的宝宝可以识别出怎样抓握和捡起小物件，但是相同的任务对机器来说却非常艰巨。机械手臂通常会根据程序识别一个物体并且对其作用预先编辑好的反应方式，但是它并不能像人类一样对变化的周围环境的产生不同的反应。对于可预期的环境与任务来说，这些编码后的机器人可以游刃有余的完成工作。但是是否可以通过“训练”而不是编码来让机器人捡起它从未见过的物件吗？

为了找到这个问题的答案，研究人员将装满随机物件的箱子摆到机器手臂面前，让其不断的重复抓取动作，随机的捡起东西。每天试验结束后，研究人员都会将数据进行汇总整理。在此过程中，机械手臂会不断通过神经网络训练，以便产生更好的预测抓握结果。经过800,000次抓握训练尝试，机械手臂开始对自己的动作进行修正。不久之后，它们成功捡起物品的概率更多了，我们甚至可以将其称之为策略——比如它们会把其中一个物件推开，以便更好的抓住另一个物体，并且针对软物和硬物会采取不同的抓握技巧。

而这些都是在研究人员并没有对抓握方式等内容进行提前编程的情况下发生的。使用反馈回路，机械手臂能够将抓握失败的比例减少到18%。研究人员打算将研究延伸到更多的抓握技巧上，并且也会尝试让机械手臂在不同的环境下工作，比如说实验室之外的现实世界中。

备注：

卷积神经网络是一种特殊的深层的神经网络模型，它的特殊性体现在两个方面，一方面它的神经元间的连接是非全连接的，另一方面同一层中某些神经元之间的连接的权重是共享的（即相同的）。它的非全连接和权值共享的网络结构使之更类似于生物神经网络，降低了网络模型的复杂度（对于很难学习的深层结构来说，这是非常重要的），减少了权值的数量。

卷积网络最初是受视觉神经机制的启发而设计的，是为识别二维形状而设计的一个多层感知器，这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。1962年Hubel和Wiesel通过对猫视觉皮层细胞的研究，提出了感受野(receptive field)的概念，1984年日本学者Fukushima 基于感受野概念提出的神经认知机(neocognitron)模型，它可以看作是卷积神经网络的第一个实现网络，也是感受野概念在人工神经网络领域的首次应用。

神经认知机将一个视觉模式分解成许多子模式(特征)，然后进入分层递阶式相连的特征平面进行处理，它试图将视觉系统模型化，使其能够在即使物体有位移或轻微变形的时候，也能完成识别。神经认知机能够利用位移恒定能力从激励模式中学习，并且可识别这些模式的变化形。在其后的应用研究中，Fukushima 将神经认知机主要用于手写数字的识别。随后，国内外的研究人员提出多种卷积神经网络形式，在邮政编码识别（Y. LeCun etc）、车牌识别和人脸识别等方面得到了广泛的应用。