百度高级副总裁向海龙:百度已经准备好全面拥抱视频时代
今天上午,第13届百度联盟生态峰会在海南召开,李彦宏并未出席,但还是发来了一段祝贺视频为本次峰会远程打call。峰会上,除了海南市政府传达对创新技术和人才引进的开放态度之外,以百度高级副总裁、搜索公司总裁向海龙为首的技术高管也向外界透露出了一个新的信号:AI技术让我们进入了新“视”代,百度将全面拥抱视频时代。
向海龙表示,技术的发展让视频成为最直接最高效的沟通方式,全民视频大爆发时代已经来临,百度依托AI能力,能够让复杂视频的生产更容易、视频的内容检索更简单。
全民视频时代来了
向海龙从人类为何成为地球的统治者的话题讲起,人类不是地球最强的物种,但人类超越其他物种的区别是具备想象力的超强神经元大脑,更善于思考,通过想象力统治了地球,进而衍生出庞大的社会合作网络。而人类文明知识的积累传承,也让每一代人类得以在此基础上更进一步,生产力生产关系逐渐远超其他物种。具有想象力的大脑和知识的沉淀和传承,是人类以并不强壮的身躯成为万物之灵的原因。向海龙认为,整个人类的进化史实际上就是知识传承方式的革命史。
而从知识积累和传承的角度来说,从远古时期人类通过口语和手势进行无法留存的沟通,到文字和纸张被发明,人类的文明和知识才得以一代代被传承。直到近代,视频让人类沟通重新回归本源,同时突破了时间和空间限制将信息实现更高效、更广阔的传递。向海龙举了两个例子,比如旅游攻略,说明书等,对比之下,视频都是比文字更简单高效的沟通和表达方式。
另一方面,向海龙也分析了视频至今未能成为主流信息记录模式的四个难点:生产难——视频生产需要专业设备,存储难——需要很大的存储空间,传输难——传输速度慢和流量资费贵使得传输成本高,检索难——基于语义理解和字面匹配的传统检索技术难以在视频这种信息载体上直接应用。
而以上难点将随着技术革新正在逐渐突破,比如智能手机、云端存储、4G网络、wifi、AI的视觉识别及语音识别等各个领域的技术革新陆续出现,原来视频不能成为记录主流模式的障碍已基本被打破。向海龙认为,因为视频的便利性,我们将进入一种“新原始”时代,让人们重新回归传统的沟通和表达方式,全民视频大爆发的时代已经到来,视频将充斥我们工作和生活的方方面面。百度将依托深耕多年的AI优势,赋能复杂视频生产和视频检索——百度AI将让全民视频时代更简单。
AI赋能视频时代, “生产+检索”更容易
向海龙提到,拍摄一个高质量视频,特效是必不可少的。而以前,视频中的高级效果大多是通过专业的后期制作实现的。现如今,通过AI技术,任何人都能轻易实现这些酷炫的效果。基于百度AI技术具备的人体识别、形体美化、人景分离、语音识别、语音合成等能力,他在现场分别演示了“瘦身”、“分身术”、“变声”的特效示例视频,呈现了百度如何让生产复杂视频更简单。
接下来,他又介绍了百度如何让检索视频更准确高效——通过对视频的全景扫描,利用语音识别、人脸识别、物体识别等技术完整分析视频中的内容,将视频背景、人物、语言等信息进行组合,百度可以给每个视频生成一个独特的指纹,大幅提升视频检索的效率和准确率。
现场演示视频充分展示了百度的AI技术让利用语音快速检索视频成为可能。向海龙还指出,当视频具有丰富标签,未来直接通过文字、语音或图像,都可以快速实现大规模的视频检索。“哪怕突然有一首歌想不起来了,只要能哼唱一段,百度就能检索出这首歌曲的MV。”
演讲的最后,向海龙表示,百度已经准备好跟合作伙伴们一起,全面拥抱视频时代。随着5G时代即将来临,人们的生活也将产生日新月异的变化。未来医疗和教育资源将更加均衡,精密的手术可以远程操作、高端教育课程可以随时随地进行,游戏的体验和真实生活将融为一体。而人们的沟通方式也可能将全面进入视频时代,区别于原始人无法被记录的“声像”沟通,新的视频时代将造就“新原始人”。视频化的“新原始时代”,存在无限可能,既是挑战,也是巨大的机会。百度希望和伙伴一起,在这个新时代创造更多的价值。