百度搜索总裁向海龙:依托 AI,大幅提升视频检索的效率和准确率
钛媒体快讯 | 5月22日消息:在今日举行的2018百度联盟生态峰会上,百度高级副总裁、百度搜索公司总裁向海龙表示,技术的发展让视频成为最直接最高效的沟通方式,全民视频大爆发时代已经来临,百度依托AI能力,能够让复杂视频的生产更容易、视频的内容检索更简单。百度已经准备好跟合作伙伴们一起,全面拥抱视频时代。
在向海龙看来,从远古时期人类通过口语和手势进行无法留存的沟通,到文字和纸张被发明,人类的文明和知识才得以一代代被传承。直到近代,视频让人类沟通重新回归原始的“指手画脚”的沟通模式,同时突破了时间和空间限制,将信息实现更高效、更广阔的传递。很多例子都能够证明,视频是最高效的沟通和表达方式。
但在这几年之前,视频依然只是文字之外的一种补充方式,未能成为主流信息记录模式,是源于视频应用的四个难点:生产难,视频生产需要专业设备;存储难,需要很大的存储空间;传输难,传输速度慢和流量资费贵使得传输成本高;检索难,基于语义理解和字面匹配的传统检索技术难以在视频这种信息载体上直接应用。
不过,随着智能手机、云端存储、4G网络、wifi、AI的视觉识别及语音识别等各个领域的技术革新陆续出现,原来视频不能成为记录主流模式的障碍已基本被打破。向海龙认为,因为视频的便利性,全民视频大爆发的时代已经到来,视频将充斥我们工作和生活的方方面面。
向海龙提到,拍摄一个高质量视频,特效是必不可少的。而以前,视频中的高级效果大多是通过专业的后期制作实现的。现如今,通过AI技术,任何人都能轻易实现这些酷炫的效果。基于百度AI技术具备的人体识别、形体美化、人景分离、语音识别、语音合成等能力,他在现场分别演示了“瘦身”、“分身术”、“变声”的特效示例视频,呈现了百度如何让生产复杂视频更简单。
随后他还介绍了百度如何让检索视频更准确高效。通过对视频的全景扫描,利用语音识别、人脸识别、物体识别等技术完整分析视频中的内容,将视频背景、人物、语言等信息进行组合,百度可以给每个视频生成一个独特的指纹,大幅提升视频检索的效率和准确率。
现场演示视频展示了百度的AI技术让利用语音快速检索视频成为可能。向海龙称,当视频具有丰富标签,未来直接通过文字、语音或图像,都可以快速实现大规模的视频检索。“哪怕突然有一首歌想不起来了,只要能哼唱一段,百度就能检索出这首歌曲的MV。”
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App