人工智能也要进击二次元界了：深度学习简化素描 So Easy！

雷锋网 • 6年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

雷锋网 (公众号：雷锋网) 按：本文为 AI 研习社编译的技术博客，原标题 Simplifying Rough Sketches using Deep Learning，作者为 Ashish Sinha 。

翻译 | 周静整理 | 凡江

素描是表达艺术思想重要的第一步，并迭代地进行设计优化。它使得艺术家们迅速地把他们的思想呈现在纸上。优先考虑尽快地将概念和想法表达出来，而非精美的细节，因而得到是粗略的草图。从最开始的草图，根据反馈迭代地进行细化直到产生最后的作品。迭代求精的过程使得艺术家们不断地清除他们的草稿成为简化版的图画，因此也意味着额外的工作量。正如人们所料的那样，手动的临摹草图以产生一幅干净的图画的过程是非常的沉闷耗时的。

人工智能也要进击二次元界了：深度学习简化素描 So Easy！

那么，如果存在一种方法可以从草图中得到干净的草图，那岂不是更好？立刻，无论使用什么样的画笔。很奇妙，是不是？在这篇文章里，我将讨论一个深度学习技术，使用全卷积网络从粗糙的草图中生成干净的草图。

好，并不是说之前没有这样的软件来做完成这样的工作，确实有，但问题是，它们通常用来做矢量图像（vector images）而不是光栅图像（raster images）。让我们从什么是矢量和光栅图像开始吧！

矢量图像和光栅图像？

光栅图像，也称位图，由颜色的单个像素组成。每个颜色像素组成了整幅图像。

光栅图像可以与点绘画相比，它们由一系列单独的彩色点组成。点绘画中的每个画图点可以代表光栅图像中的单个像素。当被看成一个单独的点时，它只是一种颜色；但当被看成一个整体时，有颜色的点构成了一幅生动而细致的画。光栅图像中的像素的作用类似，它提供了丰富的细节和逐像素的编辑。

人工智能也要进击二次元界了：深度学习简化素描 So Easy！

光栅图形由根据显示图像而排列的彩色像素组成，与它不同的是，矢量图像由路径组成，每一个路径具有一个数学公式（向量），来告诉位置形成方式，以及如何填充该位置的颜色。

由于数学公式决定了如何渲染图像，无论大小，矢量图像能够保持其外观。因而它们可以被无限地缩放。

人工智能也要进击二次元界了：深度学习简化素描 So Easy！

模型结构

这个模型最好的部分在于，它与光栅图像一起，将多个粗略的草图线条转化成一个干净的线条。

人工智能也要进击二次元界了：深度学习简化素描 So Easy！

这个结构的另外一个优点是，任何维度的图像都可以作为网络的输入，并且得到与输入图像相同尺寸的输出。网络结构十分简单，第一部分作为编码器，在空间上压缩图像，第二部分，处理并提取图像中的基本线条，第三和最后一部分作为解码器，将小的或者更简单的特征转换成与输入同样分辨率的灰度图。所有的这些全部用卷积来完成。

向上或者向下卷积结构跟一个简单的滤波器组很相似。然而，重要的是要认识到，当分辨率低的情况下，通道数量会更大。例如，当尺寸变成 1/8 时，则需要 1024 个。这保证得到干净线条的信息由低分辨率的部分执行；训练网络来选择编码-解码结构需要携带哪些信息。

填充被用于补偿卷积核的大小，并确保在步长为 1 时，输出的尺寸和输入尺寸一致。池化层被增加步长的卷积层代替，以此来降低由前一层得到的分辨率。

人工智能也要进击二次元界了：深度学习简化素描 So Easy！