奇客研究人员发现 Stable Diffusion 能压缩图像

奇客资讯 • 2年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

瑞士软件工程师 Matthias Bühlmann 发现，流行的 AI 自然语言图像合成模型 Stable Diffusion 能用于压缩位图图像，在高压缩率下比 JPEG 或 WebP 有更少的视觉瑕疵，缺陷是可能会添加原图不存在的东西。Stable Diffusion 利用互联网上数百万张图片进行训练，能根据文本描述或提示生成图像。在训练过程中，它在图像和相关词语之间进行统计关联，对每张图像提取出较少的关键信息表述，将其作为“权重（weights）”储存。绝大部分用户在使用 Stable Diffusion 时是通过文本描述去生成图像，但 Bühlmann 剔除了文本编码器，强行让图像通过 Stable Diffusion 的图像编码器进行处理，能将低精度的图像转变成高精度的潜在空间(latent space)表示，在此过程中大幅减少图像体积。测试显示一张 768KB 的图像用 JPEG 压缩到 5.68KB，用 WebP 压缩到 5.71 KB，而用 Stable Diffusion 压缩到 4.98KB。

奇客 研究人员发现 Stable Diffusion 能压缩图像

奇客研究人员发现 Stable Diffusion 能压缩图像