为训练AI系统更好地分析视频,Facebook推出两个全新的开放数据集
近日,Facebook推出了两个全新的开放数据集,用于帮助开发人员和数据科学家训练人工智能系统来更好地分析视频。
场景、对象和动作数据集(SOA)将会为开发人员提供带有多标签的大量视频。每个视频都会被训练有素的人标记,为视频发生地点、内容和具体情况添加多个标签。这些标签可以用来训练系统理解视频。
通用运动数据集则包含了一组有关特定运动属性的GIF动图(如跳跃和滑行)。正如数据集的名称,视频中所展示的主题不仅仅包含人类,所以该数据集可以被用来训练机器理解诸如熊猫跌落或小猫滑行等不同的运动行为。
这两个数据集对于使用机器学习构建更智能的视频理解系统应该是有用的。目前,机器学习系统无法从实际上理解底层视频,也无法学习优质的切向标记。而SOA数据集可以帮助解决这个问题。
以Facebook计算机视觉研究小组主导的Manohar Paluri为例,一个假定的神经网络只会在视频标签包含“皮划艇”时才会去寻找视频中是否存在皮划艇。而在处理多个视频时,系统能够处理的视频数量将会减少。
Facebook向全世界的开发人员和数据科学家发起挑战,寻找使用SOA数据集理解视频内容的最佳模式。
稳定的开发数据及是推动机器学习领域发展的关键一环。以ImageNet为例,这个由标记图像组成的数据集已经成为计算机视觉系统的重要基准。Facebook新推出的视频也将会帮助推动计算机视觉领域达到新的高度。