在博物馆庞大数据中大展身手的AI
【 图片来源: NVIDIA Blog 所有者:NVIDIA Blog 】
雷锋网 (公众号:雷锋网) 按:如果一个信息量爆炸的博物馆与先进的人工智能相结合,会碰撞出什么样的火花?NVIDIA Blog发表的文章《以色列大屠杀博物馆拥抱人工智能,以帮助游客从其庞大的档案中获得启发》或许可以告诉你,雷锋网全文编译如下:
国会图书馆数据的两倍
上周,世界各地的人们纪念了大屠杀纪念日。除了缅怀希特勒的受害者,还向那些冒着生命危险试图拯救他们的非犹太人致敬。
世界上最著名的大屠杀纪念中心Yad Vashem是一个每年吸引一百万游客的地方,有六位美国总统访问过这里,它致力于为后代保存600万年前死于德国纳粹及其合作者之手的犹太人的记忆。Yad Vashem的档案包括独特的、强烈的视频证词、短片、照片、个人书面记录、纳粹文件和音频文件。这个8亿的数字资产,包含4pb的数据,是美国国会图书馆数据的两倍。
这个世界大屠杀纪念中心,一个供全世界学者使用的文献来源的地方,其中存储的大量关于受害者和幸存者的数字媒体存档确是难以访问和查找的。研究人员跟上编制历史的步伐都是一个艰巨的挑战,更不用说更年轻的一辈去接触到它。由于这些文献是几十年来提交和发现的,经过完全数字化以后将会成为全球大屠杀学者的资料来源。因此,这家总部位于耶路撒冷的组织正在寻求人工智能的帮助,让其从海量数据中帮助识别、组织和链接照片和其他历史文件,以便更容易地发现。
Yad Vashem的团队利用深度神经网络让图像识别算法帮助索引和分类其数字历史。Yad Vashem的首席信息官Michael Lieber表示,这可能有助于找到大屠杀受害者的新的关系和故事。Lieber说:“我们是世界上第一家处理文化遗产的机构,我们决定把所有东西进行数字复刻,因为这是在全球范围内获得更广泛受众的途径。”他乐观地认为,人工智能将有助于更好地识别资源,在其社交媒体账户上讲述大屠杀受害者和幸存者的故事。他说,这可能有助于与更年轻的观众保持联系。另外,他还希望研究人员可以利用深度学习的方法来揭示一些无法被轻易发现的新的历史信息。
改进对家族史的搜寻
许多人访问Yad Vashem是为了研究祖父母和曾祖父母的遭遇,并拼凑出他们的家族史。现在的问题是,数字化数据的收集在未来几年可能会翻番,这将更难进行搜索。
Yad Vashem的技术团队旨在通过利用高性能计算驱动的深度学习来改变这一现状。该公司计划利用NVIDIA DGX-1人工智能系统的超级计算能力,通过深度学习帮助组织和扩充其历史。DGX-1在一个系统中提供了数百台基于cpu的服务器的能力,该系统的人工智能计算能力可以超过每秒千万亿次。
NVIDIA高级解决方案架构师Yuval Mazor表示,DGX-1把Yad Vashem和全球最具创新性的组织放在一起,部署人工智能以应对挑战。他说:“他们从人工智能的应用中获得了实实在在的好处。例如,Yad Vashem可以使用视频分析来理解和预测博物馆的客流量和单个展品的影响,并且可以从丰富的历史数据中提取深刻的见解。这些可以帮助Yad Vashem完成它的首要任务,即接触和教育尽可能多的人。”
Lieber说,无监督学习为训练有素的神经网络带来了为数字产品创建元标签的希望,允许深度学习将各种信息的点连接起来。 “如果你设法在Mauthausen集中营找到一张监狱卡,系统就会知道这是一张囚犯卡。它会引导你找到相关的数据字段和文档,你将能够定位和识别文档的类型,并在不需要人为干预的情况下提供额外的信息。” 他说道。
另一种选择是让大批人给数亿数字媒体资产贴上标签,并继续跟踪和更新数据库。NVIDIA在以色列的研发人员正在与Yad Vashem合作开展这项工作。
雷锋网注:本文编译自 NVIDIA Blog
雷锋网版权文章,未经授权禁止转载。详情见。