CVPR 2018摘要：第三部分

雷锋网 • 6年前扫码分享

CVPR 2018摘要：第三部分

本文为 AI 研习社编译的技术博客，原标题：

NeuroNuggets: CVPR 2018 in Review, Part III

作者 | Sergey Nikolenko、Aleksey Artamonov

翻译 | 老赵校对 | 酱番梨

整理 | 菠萝妹

原文链接：

https://medium.com/neuromation-io-blog/neuronuggets-cvpr-2018-in-review-part-iii-82a5a3129caf

NeuroNuggets：CVPR 2018年回顾，第三部分

CVPR 2018（计算机视觉和模式识别）会议已经结束，但我们不能停止回顾其精彩的论文; 今天，我们学习第三部分。在第一部分中，我们简要回顾了2018年CVPR中关于计算机视觉GAN的最有趣的论文; 在第二部分中，增加了人性化，并谈到了人类的姿势估计和跟踪。今天，我们转向Neuromation中内部研究的主要焦点之一：合成数据。像往常一样，论文没有特别的顺序，我们的评论非常简短，所以我们绝对建议完整阅读论文。

合成数据：模仿学习

合成数据是指通过3D建模和渲染（通常用于计算机视觉）或通过其他方式人工生成的数据，然后用于训练机器学习模型。合成数据在机器学习中是一个令人惊讶的主题，最令人惊讶的是它被忽略了多长时间。有关合成数据的一些着作可以追溯到2000年代，但在2016年之前它基本上没有引起任何兴趣。它所使用的唯一领域是训练自动驾驶汽车，对模拟环境的需求和收集真实数据集的不可能性使其成为合成数据集的完美情况。

现在兴趣正在迅速增长：我们现在拥有模拟室内环境的SUNCG数据集，用于驾驶和导航的室外环境，用于学习姿势估计和跟踪的合成人的SURREAL数据集，以及甚至最近应用GAN来生成和改进合成的数据（我们希望回到这一点并解释它之后的工作原理）。那么让我们看看CVPR 2018作者对合成数据的看法。由于这是我们的主要关注点，因此我们将比通常更详细地考虑合成数据的工作。

从GAN生成合成数据：特征空间中的增强和自适应

R. Volpi等人，无监督域适应的对抗特征增强
S. Sankaranarayanan等人，生成适应：对齐域使用生成性对抗网络

CVPR 2018摘要：第三部分

有一个非常有趣和有前途的领域，即使用GAN生成合成数据集来训练其他模型。从表面上看，没有多大意义：如果你有足够的数据训练GAN，为什么不用它来训练模型呢？或者甚至更好，如果你有一个训练有素的GAN，你为什么不采取鉴别器并将它用于你的问题？

但是这个想法在自适应域设置中变得更加有趣。假设你有一个大的源数据集和一个小的目标数据集，并且需要使用针对目标的源数据集训练的模型，该模型可能完全没有标记。这里，对抗域适应技术训练两个网络，一个生成器和一个鉴别器，并用它来确保网络不能在源数据集和目标数据集中的数据分布之间进行压缩。这个领域是在Ganin和Lempitsky的ICML2015论文中开始的，其中使用鉴别器来确保这些特征保持域不变：

CVPR 2018摘要：第三部分

以下是2017年对抗性判别领域适应论文中这一想法如何略微概括的示意图：

CVPR 2018摘要：第三部分

在Volpi等人的CVPR 2018论文中，来自意大利和斯坦福的研究人员使对抗训练不是在原始图像上，而是在特征空间本身。 GAN对预训练网络提取的特征进行操作，这使得有可能实现更好的域不变性并最终提高域适应的质量。以下是Volpi等人改编的整体培训程序：

CVPR 2018摘要：第三部分

另一种方法是由Sankaranarayanan等人在马里兰大学的研究人员在2018年的CVPR中提出的。他们使用GAN来利用无监督数据，使源和目标分布在特征空间中彼此更接近。基本上，该想法是使用鉴别器来控制从嵌入产生的图像保持用于源分布的真实图像，即使嵌入是从目标分布的样本中获取的。以下是它的工作原理，作者再次报告了改进的域适应结果：

CVPR 2018摘要：第三部分