压缩效率第一！CVPR图像压缩挑战赛腾讯音视频实验室胜出

腾讯科技 • 6年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

腾讯科技讯 CVPR 2018 图像压缩挑战赛（CLIC）结果已经出炉，腾讯音视频实验室和武汉大学陈震中教授联合团队于该项挑战赛上取得压缩性能第一。

CVPR是世界顶级的学术会议，自1983年第一次召开至今已经有30多年历史，在国际学术圈有很强的影响力，每年的CVPR都是计算机视觉领域的盛宴，全世界相关领域的顶尖学者、研究人员和企业都会积极参与。今年，CVPR新增了图像压缩workshop和挑战赛议程，这场挑战赛由Google、Twitter、Amazon等公司联合赞助，是第一个由计算机视觉领域的会议发起的图像压缩挑战赛，旨在将神经网络、深度学习等一些新的方式引入到图像压缩领域。

据大会官方介绍，此次挑战赛分别从PSNR和主观评价两个方面去评估参赛团队的表现。腾讯音视频实验室和武汉大学陈震中教授联合团队iipTiramisu 在 PSNR（Peak Signal-to-Noise Ratio，峰值信噪比）指标上占据领先优势，在决赛数据集上比第二名高了0.13 dB，位列第一。在其他指标上，iipTiramisu 也位居前列。

峰值信噪比（PSNR）衡量的是压缩前后两张图逐像素统计所产生的误差，峰值信噪比越高，代表两张图误差越小，也就意味着压缩后的图与原图越接近、图片质量损失越小。

iipTiramisu在峰值信噪比上有显著的优势，与业界最优秀的开源图像压缩算法之一BPG相比：

Fig.1 The Rate-PSNR curve of different encoders. (bit-rate range 0.05-0.35 bpp)

信噪比不变的情况下，在性能优先模式下iipTiramisu比BPG节省30.8%的码率，速度优先模式下比BPG节省27.9%的码率；

在码率都为0.14 bpp的情况下，iipTiramisu的峰值信噪比比BPG高1.58 dB，质量损失率明显减少。

据陈震中教授介绍，iipTiramisu团队使用了基于传统混合框架（hybrid image coder）融入深度学习的编码模块CNNMC以及CNN in-loop filter，以及基于不确定性的资源分配策略，最终可以在数据集压缩性能上比BPG提升30%以上。

iipTiramisu由腾讯音视频实验室硅谷研发中心和武汉大学陈震中教授团队联合组成。陈震中教授是武汉大学教授、博导，青年千人，主要从事计算机视觉、图像视频处理、人机交互、数据挖掘等方向的研究，近年来发表国际期刊会议论文120多篇，拥有50余项国际国内标准（H.265/HEVC/AVS）提案、10余项国际国内专利申请或授权。腾讯音视频实验室和陈震中教授团队在图像视频处理、人工智能等领域展开了深入的合作。

图像压缩技术对于互联网信息传输有至关重要的意义。一张未经压缩的 1200 万像素的图片就会占用 36MB 的存储空间，而目前网络上每天图片传输、存储数量数以亿万计，为了节省带宽资源、存储资源，减少服务器的压力，高效的图像压缩算法必不可少。

腾讯音视频实验室在图像压缩领域有很深的积累，去年5月，该实验室推出了一种基于AVS的自研图片格式TPG，其压缩效率也显著领先于JPG/JPEG、PNG、GIF、WEBP等主流的图片格式，处于世界领先水平。今年5月，TPG还因为在AVS标准制定和推广中做出的突出贡献，获得了AVS工作组颁发的年度AVS产业技术创新奖。此次获得CVPR 2018图像压缩挑战赛压缩效率第一，意味着腾讯音视频实验室在图像压缩领域又取得了一个长足的进步。