谷歌推出 AVA 数据库：让机器识别视频中人类行为

IT思维 • 7年前扫码分享

计算机视觉正在成为科技公司的一大福音，能够让机器加速运转，并完成迄今为止只能由人类完成的任务。

几个月前，eBay公布将要添加新的搜索功能，可以让用户使用现有照片来寻找类似商品，同时线上服装零售商ASOS则在时尚领域涉足此项。Shutterstock上周公布了一项全新的测试功能，用户可以根据自己的布局来搜索股票照片。过了几天，谷歌照片应用发布了新的宠物图像识别功能。

简而言之，在计算机视觉领域，发展越来越激动人心，同时也可以看到人们对人工智能领域的大量投资卓有成效。

目前，大多数计算机视觉技术的进步主要发生在静态图像领域，但我们也开始在视频中看到计算机视觉技术的成果。例如，俄罗斯当局在全国的实时监控网络中应用了面部识别技术。Pornhub也在做类似的事情，自动对“成人娱乐”视频进行分类，包括训练系统识别特定的性姿势。此外，还有蓬勃发展的自动驾驶汽车行业，在很大程度上依赖于机器对现实世界行为理解的能力。

在这样的背景下，谷歌推出了一个新的视频数据库，希望能够推动计算机视觉识别影像中行为的研究。“原子视觉行为”的英文缩写“AVA”是一个由多个标签组成的数据库，用户可以在视频序列中进行操作。

视频中动作识别的困难主要在于视频中各种复杂的场景交织在一起，多个动作也在同一时间由不同的人发出。

谷歌软件工程师顾春晖和大卫罗斯在一篇博客文章中解释道：“教会机器去识别影像中的人类行为是发展计算机视觉的一大基本难题，但是对于个人视频搜索和发现、体育分析和手势界面等应用至关重要。”“尽管过去几年在图像分类和寻找物体方面取得了激动人心的突破，但识别人类行为仍然是一个巨大的挑战。”

谷歌推出 AVA 数据库：让机器识别视频中人类行为

本质上，AVA就是一堆被80个原子动作标注的YouTube网址，并延伸到了近5.8万个视频片段，涉及到很多日常活动，比如握手、踢腿、拥抱、接吻、喝酒、玩乐器、散步等等。

通过对外开放数据库，谷歌希望可以改进机器的“社交视觉智能”，这样他们就能理解人类在做什么，并预测他们下一步会做什么。

该公司表示：“我们希望，AVA的发布将有助于改进人类行为识别系统的开发，并有机会基于时空间隔标签对复杂的活动进行建模。”

编译：网易见外编译机器人

选自：VentureBeat

审校：秦昕

随意打赏

谷歌神经机器翻译谷歌眼镜视频谷歌数据中心谷歌语音识别分布式数据库谷歌机器翻译谷歌机器狗谷歌浏览器谷歌数据库谷歌推出

谷歌诠释Pixel 9a手机设计思路：相机“圆顶”方案，探索美学新方向

砍柴网 • 1分钟前

4月12日消息，科技媒体 Android Authority今天（4月12日）发布博文，报道称谷歌回应Pixel 9a 手机相机模块灵感来自Pixel Watch的“水滴造型”，内部将其称为“圆顶”设计。谷歌Pixel 9a手机发布后，但其设计选择引发热烈
谷歌Gemini AI新功能Circle Screen曝光：圈选截屏特定区域，实现精准搜索

砍柴网 • 1小时前

4月12日消息，科技媒体 Android Authority昨日（4月11日）发布博文，报道称谷歌计划发布Circle Screen功能，支持用户圈选屏幕部分内容，实现精准搜索。谷歌近期在Instagram上发布了一段展示Gemini屏幕共享功能的视频，意外透露了一项未公开
谷歌Pixel Watch 4智能手表渲染图首曝：收窄边框、更大电池、新增双按键，有望支持无线充电

砍柴网 • 1小时前

4月12日消息，科技媒体 91Mobile昨日（4月11日）发布博文，分享了一组渲染图片，展示了谷歌Pixel Watch 4智能手表。作为Pixel Watch 3的继任者，新款手表将升级设计和性能，带来更卓越的使用体验。外观方面，Pixel Watch 4延续了前代Pi
开源数据库 KWDB 随“开放原子校源行”走进重庆大学

砍柴网 • 2分钟前

4月9日，开放原子校源行Meetup（重庆大学站）在重庆大学虎溪校区成功举办。本次活动由开放原子开源基金会（以下简称“基金会”）主办，浪潮KaiwuDB、KWDB 社区支持，围绕高校开源文化建设、数据库等热点开源技术推广、开源项目共建等话题展开交流，鼓励高校学子积极参与开源贡献。浪潮KaiwuDB 高级研发工程师冷友方
Gemini 大模型逆袭，给了 Google Cloud「AI 基建」的勇气

极客公园 • 1天前

北京时间 4 月 10 日凌晨，Google Cloud Next 2025 正式揭开序幕。如果用「AI 届的苹果发布会」来形容每年的英伟达硬件发布会，那「AI 届的 CES」或许更适合用来形容今年的 Google Cloud Next；虽然同样令人兴奋，但每一个来到现场的人都带着自己的问题，现场随处可见各种务实的交
终究是Google和Anthropic，扛下了连接一切Agent的所有

虎嗅网 • 1天前

Google Cloud Next'25大会上，Google“杀疯了”，而与其说今年的大会是一场按部就班的发布会，不如看作是Google Cloud在全球AI军备竞赛中的一次表态。面对亚马逊AWS和微软Azure这两大巨头的挤压，尽管手握DeepMind等顶尖AI研究力量，Google Cloud在市场份额上
谷歌承诺终止汽车服务和地图相关限制竞争措施，德国反垄断机构结束调查

i黑马 • 2天前

德国反垄断机构“联邦卡特尔局”4月9日发布声明称，谷歌承诺将终止与谷歌汽车服务和地图平台有关的多项限制竞争措施，该机构结束诉讼程序。德国反垄断机构此前曾对谷歌车载地图与信息娱乐系统捆绑的形式表示担忧，称这可能会阻碍竞争对手单独销售类似服务的机会。文章评价匿名用户发布发布
安卓版谷歌Chrome浏览器135优化手势导航，增强全屏沉浸感

砍柴网 • 2天前

4月10日消息，科技媒体 9to5Google昨日（4月9日）发布博文，报道称在安卓版Chrome浏览器135版本中，谷歌正逐步推送底部全屏设计更新，进一步提升网页浏览沉浸感。用户在向下滚动网页后，安卓系统的手势导航栏将不再以固定的背景色显示，而是直接叠加在网页内容之上，这
谷歌推出Vertex AI Media Studio文生视频套件：自动化包办画面渲染、旁白、配乐等

砍柴网 • 2天前

4月10日消息，谷歌今天（4月10日）推出Vertex AI Media Studio平台，该套件支持文本指令生成完整视频内容。该平台整合Imagen 3图像生成、Veo 2视频制作、Chirp语音合成及 Lyria 背景音乐四大核心模型，用户无需编码或剪辑经验，即可在统一界面完成全流程创作。谷歌近日宣布推出Verte
特朗普强推iPhone回美造，1部手机或卖2.5万元；京东自营零售业务上线伦敦；谷歌发布新一代TPU、新模型、Agent互联协议丨雷峰早报

雷锋网 • 2天前

要闻提示 1.特朗普强推iPhone回美造，美国产iPhone或要卖2.5万元，美国人恐慌性抢购iPhone2.京东国际新动作，自营零售业务“Joybuy”在伦敦上线，已完成新一轮组织调整3.台积电连续被美国施压：可能罚款10亿美元，再加100%关税4.比亚迪唐L正式上市，起售价22.98万元5.腾讯
谷歌推出 Firebase Studio 云端集成开发环境：AI 助你秒建应用

砍柴网 • 2天前

4 月 10 日消息，科技媒体 bleepingcomputer 昨日（4 月 9 日）发布博文，报道称谷歌发布 Firebase Studio，是一款基于云端、人工智能驱动的集成开发环境（IDE）。用户无需深入编程，只需输入提示词，AI 就能迅速生成完整的应用程序。该工
NIH对中国关闭核心数据库，科学家们最担心什么？

虎嗅网 • 1天前

“You access to dbGaP has been suspended”，上周许多生物医学领域的学者都收到来自大洋彼岸的这样一封邮件。 4月2日，美国国立卫生研究院（NIH）发布了一份《实施更新：增强 NIH 受控访问数据的安全措施》文件，宣布从2025年4月4日起，禁止位于中国
浪潮KaiwuDB 入选 Gartner 数据库市场指南及数据技术成熟度曲线双报告

砍柴网 • 17天前

2024年末，国际权威 IT 研究与咨询顾问机构高德纳（Gartner）发布《中国数据库管理系统市场指南》（Market Guide for DBMS, China），浪潮KaiwuDB 作为中国数据库管理系统领域代表厂商入选该报告，其创新研发的分布式多模数据库系统 KaiwuDB 入选典型产品。与此同时，KaiwuD
时序数据库IoTDB助力德国铁路与宝马车厂构建数字化解决方案

砍柴网 • 23天前

1. 业务背景德国普戈曼公司（pragmatic industries GmbH，以下简称普戈曼）是一家位于德国的 IT 服务和咨询公司，专注于为工业领域提供物联网解决方案，利用时序数据库等软件帮助企业处理和分析工业数据，以优化工业物联网应用中的现有流程，提高生产效率与产品质量，并节约能源和资源。不
时序数据库IoTDB如何破解交通运输时序数据管理难题

砍柴网 • 24天前

如果说维系人类生命的源动力是血脉，那么交通运输就恰似国家经济、社会发展的血脉。交通运输不仅保障了物资的顺畅流通，支撑着各行各业的生产运营，还为人们的日常出行提供了便利。国家对交通运输的发展始终予以高度重视，近年来相继出台了诸多政策举措。“交通强国” 战略的提出，明确了构建安全、便捷
金仓数据库亮相第十五届航空航天数字化建设合作峰会

砍柴网 • 28天前

3月13日，由中国信息产业商会主办，中国信息产业商会数字经济专业委员会共同承办的第十五届航空航天数字化建设合作峰会在北京隆重召开。峰会以“ 科技创新引领新质生产力”为主题，邀请到国家部委相关领导，国家级专家、院士以及航空航天领域企事业单位、科研院所、社会组织、行业
对话泽拓科技赵伟：数据库公司深陷的“自研军备竞赛”，用户真的在意吗？

雷锋网 • 1月前

泽拓科技的 CEO 赵伟穿着灰色西装外套坐在办公桌前，说话音量不大，带着微笑和极客特有的真诚与激情。面对雷峰网关于数据库产品自研与否的提问时，他保持着徐徐的语调，一字一句说：“我们从一开始就大大方方在社区里讲，我们是基于社区版的 MySQL 和 PG 深度研发了大量内核增强、优化扩展和新功能组件，使二者发生‘核聚变反应
时序数据库IoTDB为某大厂多领域物联网场景提供数字化管理基座

砍柴网 • 1月前

1. 业务背景某大厂物联场景从消费领域扩展至城市数字化建设、分布式可再生能源等多个方向。物联解决方案主要分为四大板块：工业互联网：融合云计算、物联网、大数据、AI、区块链等技术，发挥产业链和供应链优势，赋能多行业生态。能源双碳：基于分布式可再生能源产业变革现状，
山石网科分享信创之路及对国产数据库应用的探索

砍柴网 • 1月前

2月26日，山石网科受邀参加阿里云PolarDB开发者大会。在此次备受瞩目的行业盛会中，山石网科围绕国产化安全这一关键议题，分享了《山石网科的信创之路及对国产数据库应用的探索》，全面且深入地展示了公司在国产化安全领域的前沿思考和积极探索，为推动国产化安全方向的发展贡献了独特的力量。作为中国网络安全行业的技术创新领导厂商
对话ClapDB李令辉：AI爆发让数据库市场价格战失去意义？

雷锋网 • 1月前

价格战，是这两年国内数据库行业面对的共同困局。ChatGPT 狂奔后，市场融资风潮转向更有想象力的 AI，企业们的大头成本也烧在了 GPU 上。在 ClapDB 的 CEO 李令辉看来，AI 的出现，让前两年数据库价格战场的硝烟弥漫都沦为烟雾弹：对于许多大企业来说，AI 时代下 GPU 成本预算可能占 50% 以上，在

评论