Google街景是如何识别门牌号的?

Google街景是如何识别门牌号的?
知道Google街景是如何识别各种千奇百怪的门牌号的吗?靠的是它搭建的一个疯狂的神经网络。
我们知道,在受约束环境下(如文档处理)的字符识别技术,比方说OCR技术已经被研究得很透。但是对照片中的多字符文本识别却是个难题,因为这些照片中的字体、颜色、样式、方向、排列不一,再加上光照、阴影、镜像、遮蔽等环境因素影响,还有图像本身的分辨率、焦点模糊、抖动等问题。而传统的图像文字识别,一般要经过字符定位、分割和识别三个步骤,处理效率不高。考虑Google街景的每天上传的图片量,以往的这些方法显然缺乏实用价值。
为此,Google开发了一套大型的神经网络来处理海量的Google街景图片中的门牌号识别问题。这个神经网络的代号是DistBelief,其学名是深度卷积神经网络,我们之前曾介绍过这套会思考的深度学习系统。经过DistBelief训练的这个大型分布式神经网络,可以把定位、分割和识别三个步骤集成到一起,直接对每一个像素进行操作。其性能随着神经网络的深度增加而提高,在11层的时候达到最高。
根据论文的数据,该系统对SVHN(街景门牌号数据集)中的门牌号识别率达96%,而单数字识别率达97.84%,对于Google街景图库的上千万门牌号的识别率也超过90%。该系统每天可识别百万门牌号(不到1小时即可将法国的街景照片中的门牌号找出来)。目前该系统已经帮助Google从街景图中分析出全球近1亿个门牌号。
感兴趣的可到此处下载Google的这篇论文:Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks。
[本文参考以下来源:gizmodo.com]
-
30
- 发送长微博
- 分享到微信

boxi
作者Keep It Simple, Stupid!
-
Yahoo收购IQ Engines
-
Everpix可理解照片内容并归类
今日更新+11
微信公众平台:搜索“36氪”或扫描下面的二维码:

- RSS

热门文章

隐藏游戏也玩O2O?一把枪,一个app,Dustcloud把隐藏游戏搬到线下来了

一周投融资简报(01.06—01.12)金融、手游、旅游、企业服务、人人贷、携程

为了不让摩尔定律失效,我们该如何设计下一代芯片?

传奇般的Angela Ahrendts能帮苹果再次掀起零售革命吗?(三)

一周文章精选+《氪周刊:互联网创业必读》http://www.36kr.com/p160

Google街景是如何识别门牌号的?
- 社区新帖
- Startup-X
- 8点1氪
洞察互联网的20本书
要在2020年以前实现中国经济的转型
邵逸夫老先生的长寿经能复制吗
汤唯遭电信诈骗被骗21万
互联网金融还是大数据金融?
2014电视行业主趋势:互联网电视简易化
40张图帮你重新认识世界
春秋战国时期到临?
互联网金融独立于银行及资本市场模式by中投公司副总经理谢平
- 用温度看世界:内置FLIR ONE热成像摄像头的iPhone手机壳闯来了
- 你要是跳支舞,运动追踪仪Notch就能告诉你哪儿做得不标准
- http://www.36kr.com/pStartup Xhttp://www.36kr.com/p 能把内容变现的知乎:Teckler通过广告分成帮你挣些辛苦费
- 开源EEG平台OpenBCI—重新认识“动脑筋”这种时时在场的交互方式
- 大众点评不如小众点评:邀请制服务点评推荐平台byUs以靠谱评论和熟人圈子做推荐社区,获天使轮融资150万美元
- 因为有种信息匮乏叫做“海量数据”,所以社交媒体时代的通讯社Storyful才存在
- 让你在屏幕前就能参观房产"实景",房产3D可视化服务商Floored融资526万美元
- 云端客服解决方案服务FreshDesk获700万美元融资,引入游戏化机制让客服工作变得有趣
- 黑客眼里没有禁令:Lambda实验室将发布首款基于Glass的人脸识别应用FaceRec