智能影像技术助力视频内容自动生产 文化媒体领域受益显著
近年来,世界众多知名专家学者主张,人工智能(Artificial Intelligence)应被重新定义为增强智能(Augmented Intelligence)。国际研究机构Gartner具体将增强智能表述为:人工智能和人工智能协同工作以提高包括在学习、决策以及新体验等方面认知能力的一种人际关系模型。Gartner预测2019年人工智能增强将在为企业创造价值方面高居首位,在2021年为全球创造2.9万亿美元的 商业 价值和62亿小时的工人生产力,而这主要归功于“自动化”,通过自动化提高效率是人工智能增强的主要目标。
当前,人工智能技术正通过人脸识别、物体识别、视频分析及处理等方式渗入全球各产业行业。德勤调查(Deloitte Research)认为,TMT(电信、 媒体 和 科技 )行业企业在人工智能投入以及技术应用经验方面走在前沿。特别是在文化和媒体领域,人工智能技术通过自动化生产为内容开发、客户体验等方面发挥了明显的创造力作用。
事实上,采纳人工智能技术在一定程度上缓解了文化和媒体领域的“挑战”——随着5G时代的临近,增强移动宽带(eMBB)将使得网络视频迎来爆发期,信息主体的视听化正成为一个不可逆的趋势。用机器自动化生产视频内容替代大量人力工作,可能是当下最为合适的一种技术解决办法。以某视频平台为例,其应用国内AI企业影谱科技(Moviebook)的AGC(Automatic Generated Content)智能影像自动生产解决方案,大规模在其原创“影视剧综”作品内自由嵌入机器自动化生产的视频内容,或替换原视频内容的场景或物品,这有助于内容版权方降低制作投入、提升视频生产效率,并同步提高商业化效率。
图:影谱科技通过智能影像生产技术自动生产内容
影谱科技的AGC,首先通过MCVS技术(Moviebook Motion Capture from Video System)对现有视频的关键帧进行抽取,理解、关联及预测等处理,将视频内容分割为像素及子像素维度的结构化数据,并自动完成标记,即形成了对视频中各种内容的自动化理解和标注。接下来,利用3D虚拟重建等计算机图像技术,通过视频内容自动化生产引擎MAPE(Moviebook Auto-Production Engine)生成全新的视频。与传统视频生产相比,影谱科技AGC解决方案融合了人工智能多模态语义理解,并利用深度学习实现视频自动化加工以及视频的同步生成,是一种全新的视频影像生产方式。
根据Forrester访谈发现,因海量用户数据沉淀,以及多维应用场景推动,基于AI的影像自动化生产技术在文化和媒体领域具备天然规模化优势,为产业数字化转型升级和商业创新方面带来重要支撑。
目前,Disney、Netflix、HBO等国外企业也都在AI影像技术方面开展积极布局。全球文化娱乐巨头Disney积极在AI影像领域加大投入,利用AI和专业特效技术整合,成功开发了一个覆盖电影创作、制作以及后期过程的智能系统,在编剧创作阶段,可从自然语言故事中提取信息,并拥有推理以及查询互动功能,自动形成可视化动画或视频;在电影拍摄中,通过初步自动生成简单动画,进行现场整合及语音录制,带上 VR 头显更可直接在虚拟场景中进行预览。
美国FOX Sports致力于提供优质体育及热门视频内容,其积极采用AI影像技术,扩展采编人员能力,改变传统内容生产流程,无需后端专业视频编辑人员参与即可每天发布10-20个高质量视频,有效提升内容产出效率。
国内方面,作为中国三大视频平台之一的优酷,早在2017年便构建泛内容大数据智能预测平台——鱼脑,为内容策划、制作、 营销 、商业化提供数据参考和支持;2018年世界杯期间还开发“鲸观”技术来自动理解视频内容和剪辑,提高平台内容制作运营和商业转化全链路效率。
目前机器生产视频在文化和媒体行业中的应用已十分广泛,AI影像自动化生产作为多媒体视频内容表达和互动创作分发的核心生产力,在智能视频编辑、影视轻工业、视频信息可视化等方面发挥重要作用,未来在5G 等新技术的进一步加持下,AI技术也将为自动化生产在内容、渠道以及效率方面带来更多值得期待的可能性。