谷歌图像识别 API 向所有开发者开放
在结束了短暂的 受限预览 之后,谷歌今天 发布 了 Cloud Vision API (应用程序接口)的公测版。这一服务将帮助第三方开发者在自己的应用中集成图像识别和分类功能。
谷歌的技术能完成基础性功能,例如从图像中提取文字。不过,这一技术真正强大之处在于识别图片中的对象。这与谷歌 Photos 的图片搜索功能采用了同样的技术。而谷歌 Photos 能够识别花、食品、动物,以及本地地标等对象。谷歌表示,这一算法经过了训练,能识别“数千种”不同对象。
图片分类或许是这一 API 最有趣的功能。不过,这一功能也可以用于过滤不适当的图片内容。例如,如果希望确保某一图片类应用获得“PG”分级,那么 Cloud Vision API 可以帮你方便地做到这一点。而如果你希望在图片中只看到开心的人,那么 Vision API 也可以帮你判别人物情绪。
谷歌今天还公布了使用这一 API 的价格。开发者具体需要支付的费用与使用量密切相关。例如,标签识别的价格为每千张图片 2 美元,而基本的光学字符识别的价格为每千张图片 0.6 美元。
在测试期间,谷歌将对用户作出限制,即每月最多识别 2000 万张图片。谷歌表示,在预览期内,已有多家公司配置了这一 API。例如,Yik Yak 使用这一 API 去提取文字。
通过 Vision API,谷歌将与微软 Project Oxford 等项目展开竞争。后者目前仍处于技术预览版阶段。Project Oxford 提供了用于计算机视觉、人脸识别,以及情绪分析的 API。
翻译:维金
Google Opens Its Cloud Vision API To All Developers