Facebook的深度学习系统可造出以假乱真的图像

36氪 • 9年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

在Google、微软、百度等巨头的推动下，人工智能技术的发展突飞猛进。能识别图像已经不算什么本领了，现在Faebook的AI技术已经几乎可以以假乱真，令受试者在40%的时间把计算机生成的图样当作是真的照片。

这项成果是由Facebook人工智能实验室的三位研究人员Soumith Chintala、Arthur Szlam、Rob Fergus与纽约大学库朗计算机科学研究所的Emily Denton联合完成的，论文题目叫做《用对抗网络拉普拉斯金字塔的深度生成式图像模型（Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks）》，Facebook已经把论文提交到即将在蒙特利尔举行的神经信息处理系统大会（NIPS，AI业界最著名的会议之一）上供讨论。不仅如此，Facebook还打算稍后（可能下周末）将工作的代码开源出来供大家参考。

简单来说，Facebook的AI技术可以自主生成一些含有飞机、汽车、小鸟等东西在内的场景图像样本令观看者信以为真。Facebook这项研究成果的特别之处是，其AI采用的是无监督学习。以往包括Faebook在内的大公司和初创企业采用的普遍都是监督式学习，即需要利用大量带标签的数据去训练人工神经网络，后者才能逐渐学会识别东西。比方说，给它看1000张猫的图片，看多了之后AI才会逐步对猫建立模型并识别新的图像。

Image title

Google的人工神经网络可以根据原图生成带魔幻色彩的图像，但Facebook的Rob Fergus认为，自家生成以假乱真图像取得的技术进展更高。

而无监督学习中样本数据是不包含标签的。这更接近于人学习认东西的方式。比方说，看过1、2部手机之后，我们很快就能认出第3部。在实现上，Facebook采用了两套受训神经网络，一套是产生式的，赋予其随机向量后就能生成图像；而另一套则用来确定图像是否看起来是真的。目前这套系统能生成64x64像素的图像。

由于不需要对训练数据打上标签，这项技术无疑可以帮助Facebook更好地进行图像、视频、语音的识别工作，自然语言处理技术也可以相应提高。Google前两天也公布了自己的一项 AI成果，利用人工神经网络生成迷幻图像。尽管看起来很酷，但Facebook的研究科学家Rob Fergus认为，与Facebook可生成以假乱真图像相比，自家的技术显然更难，取得的学术进展更多。当然，64x64的分辨率尚不具备使用价值，Facebook的下一步计划是逐步提高生成图像的分辨率，届时，虚拟与现实的界限将进一步模糊，人类距离AI的圣杯越来越近了。

本文参考了多个信息来源： venturebeat.com 、 arxiv.org 、 googleresearch.blogspot.com