AI换脸、合成语音大爆发!清华《深度合成十大趋势报告(2022)》发布

数据观  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

作为人工智能领域的新实践,近年来,利用深度学习、虚拟现实等生成合成类算法制作图像、音频、视频、虚拟场景等信息的深度合成技术,已在多个领域大量应用,伴随着不断涌现的使用需求,深度合成内容数量和关注度呈现快速增长态势。但另一方面,恶意使用该技术生成的音视频,也显现出了巨大的破坏力,给个人、企业造成了声誉损害和财产损失,也对社会、国家安全造成威胁。

近日,清华大学人工智能研究院、北京瑞莱智慧科技有限公司、清华大学智媒研究中心、国家工业信息安全发展研究中心、北京市大数据中心联合发布《深度合成十大趋势报告(2022)》(以下简称“《报告》”),从技术研究、领域应用、发展趋势等多个方面,全面深入地介绍和研判深度合成技术及应用带来的机遇与挑战,并就其发展与治理给出切实可行的建议和措施。

   多个领域落地应用,深度合成内容迎爆发式增长

深度合成的图像、视频、音频、文本等内容,例如热门影视剧片段、话题明星的换脸视频等等,具有极强的娱乐性与传播性,伴随着技术的发展成熟,越来越多的创作者在互联网上发布和分享深度合成内容,数量逐年高速增长。

数据说明:在10家国内外平台中(爱奇艺、腾讯视频、优酷、哔哩哔哩、抖音、快手、微博、YouTube、Twitter、 TikTok),以“Deepfakes”等10个中英文关键词进行检索,并通过URL去重后,统计出数据结果

以视频为例,《报告》显示,在国内外主流音视频网站、社交媒体平台上,2021年新发布的深度合成视频的数量较2017年已增长10倍以上。此外,深度合成内容关注度也呈指数级增长,通过对互动数据进行统计,2021年新发布的深度合成视频的点赞数已超过3亿。

数据说明:在10家国内外平台中(爱奇艺、腾讯视频、优酷、哔哩哔哩、抖音、快手、微博、YouTube、Twitter、 TikTok),以“Deepfakes”等10个中英文关键词进行检索,并通过URL去重后,将具有视频分类标签的数据进行统计得到的分析结果

正因为如此,深度合成在影视制作、广告营销、社交娱乐等领域发展出多元化的商业应用,例如AI合成主播、虚拟偶像、修复历史老照片、影视剧本地化配音、“数字复活”已过世演员等。

一些面向公众开发的合成类产品也陆续推出,《报告》显示,视频、语音和文本形式的服务最为普遍,例如支持风格定制的特效视频制作软件等风靡网络;语音方向衍生出了语音导航、有声读物、自动新闻播报等应用;文本合成则在新闻报道、诗文创作、聊天问答等方面发挥着重要作用。

   风险加剧,技术检测成重要应对举措

深度合成激发了新内容创造力的同时,也带来了新的威胁。随着技术逐步“平民化”,不法分子可轻易伪造音频、视频,实施诬陷、诽谤、诈骗、勒索等违法行为,甚至捏造国家政要言论扰乱社会与政治秩序。

2021年10月,安徽合肥警方曾查获一起非法利用深度合成技术伪造手机用户人脸动态视频破解身份核验,为黑灰产业提供注册虚拟手机卡等技术支撑的案件。近年来,类似事件开始更多的进入公众视野。

深度合成内容模糊了真实和虚假的边界,将对社会信任、媒体信任、政治信任产生巨大的影响。负面风险不断加剧,如何有效甄别深度合成内容就成为了关键,但随着合成质量的不断提升,传统基于生物特征的鉴别方式越来越难以发挥作用。

数据说明:在arXiv中,论文摘要范围内以“GAN”等16个关键词进行检索,统计图像、视频、音频、文本合成领域的论文发表数量

《报告》显示,目前学术界和产业界均已对反深伪检测投入了大量研究,Meta(原Facebook)、谷歌、微软等机构均推出了深度合成视频认证的方法或产品。

   构建多维度治理机制,引导深度合成技术良性发展

   深度合成技术的良性发展,离不开多维度治理机制的探索。

《报告》显示,除了发展深度伪造内容检测技术以外,近几年来,针对深度合成技术恶意使用所带来的挑战,世界各国纷纷出台相关法律法规,探索深度合成的治理路径。国际方面,美国从联邦和州层面进行专门立法,欧盟将深度合成纳入《通用数据保护条例(GDPR)》等现有法律框架规制。此外,德国、新加坡、英国、韩国等国家,均有适用于深度合成技术相关犯罪案件审理的法律法规。

我国也在积极探寻有效的治理机制。2019年11月起先后出台的《网络音视频信息服务管理规定》、《网络信息内容生态治理规定》、《中华人民共和国民法典》、《互联网信息服务算法推荐管理规定》,均对生成合成类内容等提出了不同程度的监管要求。今年1月,国家网信办公布了《互联网信息服务深度合成管理规定(征求意见稿)》,对深度合成内容的用途、标记、使用范围以及滥用处罚作出了具体规定。

《报告》也建议,各方应当与时俱进落实好新的规范要求,并在此前提下不断追求技术突破,不断开拓深度合成技术应用场景,创立示范标杆,形成对人工智能行业整体的带动效应,从而促进新技术的持续健康发展。

具体内容如下


AI换脸、合成语音大爆发!清华《深度合成十大趋势报告(2022)》发布

AI换脸、合成语音大爆发!清华《深度合成十大趋势报告(2022)》发布

AI换脸、合成语音大爆发!清华《深度合成十大趋势报告(2022)》发布

责任编辑:蔺弦弦

随意打赏

提交建议
微信扫一扫,分享给好友吧。