全球视频识别技术趋势:影谱科技擅长商业化、迪士尼擅长工具化
据彭博社报道,2013年第一季度,只有6家公司在其财报电话会议上提到人工智能,而2017年第一季度这一数字增长到了244个,2018年第一个季度增长至572个。
风险 投资 公司MENLO VENTURES的常务董事MATT MURPHY表示:“在技术浪潮中,人们意识到人工智能和机器学习都是风口浪尖的技术。” MATT MURPHY表示,“科学已经有了很大的进步,现在已经准备好了进入实践模式。”
事实上,视频识别正成为继图片识别后的又一大人工智能方向。
“视频一直被视为计算机视觉里的暗物质。”在Google Cloud Next大会上,机器学习的权威李飞飞博士如此说到。虽然视频能提供比文字和图片多得多的信息,但一直以来,视频内容都像一个黑洞,搜索引擎最多只能借助视频上传者选择的标签进行索引。
为了解决这样的问题,Google以“视频识别API”为解决办法,把视频结构化标注开放给开发者。而Facebook负责机器学习技术的高管康德拉(Quionero Candelae)在F8开发大会上表示,正在开发一个新功能,能够对视频中出现的人物进行身份识别和标注,方便进行搜索。
在全球范围内,视频识别正成为继图像识别后的又一大市场,这与全球高速增长的视频应用密不可分。不仅是Google、Facebook等,包括来自中国、美国等人工智能独角兽企业均在积极探索视频识别(Video Intelligence)领域的各种可能。
其中,包括Facebook、迪士尼、影谱 科技 等企业提及最多的是“视频识别与AR/ VR ”的融合。
Facebook视频识别,对视频进行标注,广泛应用于视频审核、VR-Oculus Go。
Facebook计划到2020年将其人工智能部门翻倍,这表明该公司认为它的重要性,Facebook的FAIR、AML正在成为最重要部门。Facebook重整FAIR,偏向 商业 化,目的就是要让研发成果更加贴近Facebook的产业布局。
AML团队负责人Joaquin Candela表示:“人们使用Facebook全系列产品的体验主要取决于人工智能技术,如今,如果没有人工智能,Facebook就不可能存在。”
在业务层面,网络视频正成为Facebook重点发展的业务,其视频浏览量接近YouTube。服务业务更好商业化成为FAIR、AML的首要任务。
媒体 分析指出,Facebook已经在人脸识别上取得一系列瞩目商业化进展。
其2017年曝光的一项新技术显示,Facebook正在大力发展视频识别的基础——模糊识别及推演:人工智能系统可以根据照片中人物的发型、服饰、身材、姿势等信息来识别身份。事实上,Facebook计划把这一身份识别推进到视频领域。
Facebook负责机器学习技术的高管康德拉(Quionero Candelae)表示,Facebook将可以对视频每一个画面中的人物进行识别,并进行永久的数据索引。在视频人脸识别中,Facebook也可能沿用一些类似的技术:比如,它已经建立了一个机器学习模型来检测潜在的虚假照片或视频,然后将这些模型发送给其事实检查员进行审查,第三方事实检查合作伙伴可以使用视觉验证技术,包括反向图像搜索和图像元数据分析来审查内容。
Facebook CEO马克扎克伯克在最新一季财报分析师沟通会上透露,视频识别已成为旗下视频在线产品、VR产品的核心竞争力之一。其Facebook Oculus最新推出的VR产品Oculus Go中即广泛应用到“视频识别技术深度融合VR”。
Moviebook影谱科技,擅长视频识别+3D/AR/VR融合技术的中国视觉技术领军企业
计算机视觉是中国AI市场的最大组成部分,也是商业变现最顺利的人工智能技术技术之一。根据中国信通院2018年2月发布的报告数据,2017年中国人工智能市场中计算机视觉占比37%,以80亿元的行业收入排名第一。
在视频识别领域,一家中国人工智能企业影谱科技Moviebook强调“视频识别+3D/AR/VR”融合。这是一家在视频识别辨识度、产品化程度、商业规模综合排名前列的图像视觉识别企业。该公司的目标是完善自己的自动化技术,从而能够在中国人工智能同行中竞争而出,最终将智能影像生产技术方案出售给那些希望降低劳动力成本的企业。
Moviebook影谱科技将“视频识别+3D/AR/VR”多种技术加以叠加、整合,实现了规模化的视频识别及自动化内容生成、植入,为不同行业提供基于智能影像生产技术的智能化工具。在实现工具化及商业化后,影谱科技迎来“AI赋能行业”的增量空间。
在现实应用中,智能影像技术可以让视频内容自动生产——无需人工干预,它能对视频内容的像素及子像素进行自动分析,从而自动生成内容,在影视剧领域以降低大量的审核人员成本、内容制作成本;
在视频 互联网 服务方面,影谱科技推出多维度适配技术,以便让各家卫视及网络视频平台都能自动接入,实现“全终端、全格式编码解码、多种加密解密及传输协议的适配”。
在应用在视频行业 营销 及变现领域,影谱科技为如影视剧及综艺制作企业,及芒果TV、搜狐视频、腾讯视频等视频互联网企业提供原生视频广告解决方案。
这一系列核心技术及产品商业化为影谱科技构建了颇高的商业壁垒,成为视频识别技术垂类领域的全球代表企业:一方面是因为影谱已经与行业合作形成了“影像生态上的协同价值”,另一方面则是由于合作者“很难在既定技术条件下选择其他供应商”。
随着视频成为中国年轻人的主流信息载体后,影谱科技从视频识别技术到实现全自动化的“智能影像生产技术”获得全球知名人工智能企业及风险投资机构的认可。在2018年第三季度,影谱科技获得商汤科技、软银中国等机构人民币15.6亿元的注资。
GOOGLE DeepMind视频识别,除自身应用外拓展至军用无人机航拍影像识别
谷歌是这个地球上最出色的人工智能企业之一,旗下的DEEPMIND研发出了ALPHA,近期,它又宣布推出测试版本的智能云视频服务(Cloud Video Intelligence),将视频认知能力提升到了新的高度。该业务支持自动识别视频中的物体,使得它们变得可以搜索,可以让开发者开发能够自动识别视频中的物体的应用程序。
除了提取元数据之外,该API还能帮助标记视频中的场景变化。
视频内容识别对Google具有重大的使用场景,比如在安全、冲击恐怖主义等领域,政府或许警方可以对视频画面进行实时的监控和剖析,迅速抓捕恐怖分子。
谷歌搜索部门负责人本·戈麦斯(Ben Gomes)说,语音识别和视频理解是未来搜索和信息的核心。事实上,随着人类信息载体的变法,视频正成为年轻人最主要的信息载体之后,由李飞飞教授领衔推出的Cloud Video Intelligence正成为下一代Google的核心竞争力之一。
近期,有媒体报道,谷歌已经开始参与美国国防部代号为Maven的项目,该项目旨在识别出由无人机航拍的影像中出现的物体。据美国安全中心研究员格雷戈·艾伦(Greg Allen)称,Maven项目的第一个任务是帮助美国国防部高效处理由无人机航拍的大量视频。这些视频的数量相当大,以至于无法由人工来完成其分析任务。在Maven项目开始之前,国防部内还没人知道如何将人工智能技术应用到视频分析中。
Google成为全球第一家把视频识别技术应用于军用无人机航拍的影像识别。
Disney,视频识别及视频分析客户数据辅助业务决策
很多电影公司也开始引进人工智能辅助决策,迪士尼可能是全球最人工智能的电影制作公司。
迪士尼开发了分解式变量自动编码系统,该系统通过深度学习和面部扫描实时捕捉观众的表情,分析电影观众在不同剧情时段的反应,为之后电影项目策划和创作提供了更为精确的用户数据。
除此之外,迪士尼研究院数字平台小组负责人Sasha Schriber在VRDC 2018演讲中表示,迪士尼研究院正在研发一款新人工智能技术,旨在针对电影制作中的一项关键步骤——预可视化,即将自然语言脚本转化为粗略的草图动画,让导演更直观地了解角色将如何在场景中进行表演,以及脚本的变化会怎样影响场景。将自然语言脚本转化为可视化预览动画的技术将投入VR及传统电影创作中。
Conviva,来自美国的视频识别及分析企业
Conviva是一家基于人工智能进行视频识别及分析的企业,企业以机器学习为基础,致力于开发视频分析技术,同时为视频制作者提供“虚拟直播房间”,好让观众从其他角度观看视频内容,近日,Conviva获得4000万美元战略投资,由Future Fund、NEA、Foundation Capital和时代华纳投资。
目前该公司客户共计200多家,包括HBO、Sky、Turner等;每天要分析来自全球25亿台设备,超过10亿分钟的视频。