腾讯狂揽OCR“奥斯卡”四项冠军 腾讯云赋予场景变革“超能力”
11月9 日,具有OCR领域的奥斯卡盛会之称的“第 14 届国际文档分析与识别大会(ICDAR)”,揭晓了2017 ICDAR竞赛结果。腾讯数平精准推荐团队首次出征便凭借自研的“时空上下文感知的OCR深度学习算法” 斩获四项冠军。腾讯的OCR技术已在多种场景下落地,推动各个行业智能化改革。
(ICDAR2017获奖证书)
OCR技术落地,给予全新解决方案
国际文档分析与识别大会(ICDAR)专注于文本领域的识别与应用,自 2003 年大会设立“Robust Reading Competitions”以来,该竞赛就成了评测和检验自然场景/网络图片/复杂视频文本自动提取与智能识别最新技术研究进展的最为重要的国际赛事及标准,竞赛中的诸多方法对OCR技术的发展具有强大推动力。高技术难度、强大实际应用性,也使该盛会受到科研院校、 科技 公司等的关注,至今已有 89 个国家的 3500 多支队伍参与。
(参赛队伍数量统计)
据了解,首次参与竞逐的腾讯数平精准推荐团队在文本识别领域上已深耕多年,自研的基于深度学习方法的文本检测与识别技术在往届ICDAR竞赛数据集上也曾多次刷新世界纪录。相关技术在腾讯内部多款产品成功应用,特别在广告推荐的场景中,通过OCR 技术深度识别和理解广告素材创意,大幅提升了用户点击率预估的效果。
基于腾讯业界领先的OCR核心能力,腾讯云将OCR文本识别和检测技术真正落地,深度介入印刷体和手写体存在的各种场景,给予行业流程繁琐、效率低下以及成本居高不下的全新解决方案。
智能解放生产力,助力行业标杆
OCR是人工智能里面非常重要的基础能力之一,对于传统行业,在优化业务流程、解放生产力和降低企业成本方面,实效凸显。而受众群体极广、业务量相对较大、频次较高的物流场景对这一技术的追求,显得迫切,纷纷通过与腾讯云合作成就行业标杆。
物流行业劳动密集型的属性,在顺丰身上比较明显。据悉,目前顺丰拥有将近 20 万地面小哥,平均每天传递将近 900 万个包裹和商务信件,这在以前需要顺丰雇佣大量输单员手动输入运单信息。和腾讯云合作之后,凭借OCR技术,实现快速识别手写体和打印体的快递单,准确率高达91%。以往因容易认错而加大物流中的人力、物力和时间成本的潦草的手写寄件收件信息,也能够识别,正确率接近人工识别水平。最终,通过“7X24”服务能力,和 3 小时内识别 2000 万张订单信息的处理能力,极大的提高了物流整体效率,而且不经人工,也一定程度上降低了用户隐私泄露的风险。
腾讯云与中国外运合作也是一个典型的OCR识别技术智能实践案例。中外运是国际整合物流服务商,海外网络覆盖全球五大洲,其每年业务系统订单超过 300 万,而在传统作业方式下,人工识别、录入一笔单据需要 3 分钟。而通过应用腾讯人工智能OCR技术,识别单据仅需 4 秒,而且实现识别即入系统,效率提升 45 倍。据了解,除了单据录入,中外运在订舱委托、订舱确认件、提单样本、发票等环节都应用了OCR技术,传统人力操作业务流程彻底变成自动化智能化,降低企业负担。
强大技术能力,支撑多场景应用环境
除了物流行业场景的天然需求,腾讯云的OCR技术方案还被广泛应用在 金融 、保险以及政府部门等行业组织场景中的证件识别,如身份证、驾驶证、行驶证、营业执照、车牌、名片等。据了解,目前腾讯云的OCR技术已支持数字识别,和超过 7000 个常用汉字的识别。针对身份证识别,腾讯云OCR技术已支持身份证的正、反面识别,一次扫描即可识别所有字段,对于像倾斜、暗光、曝光、阴影等异常场景环境的识别,也能保障准确率,其通过自适应判别纠正技术,将身份证上的数字识别准确率提高到99.9%以上。而对印刷体名片,其能自动识别和定位姓名、 手机 号、QQ等字段,并实现 30 度以内的角度偏转,姓名字段与手机号码字段的自动识别准确率超过90%,领跑业界。
值得一提的是,传统的营业执照信息录入,要依赖人工对信息进行录入、处理和核对,存在信息录入错误、效率低等问题。依托OCR识别技术,上传营业执照便能自动识别名称、执照号等,支持核实与纠正识别的信息。避免繁琐的人工输入,同时又能提高注册和客服审核的效率与准确度。对营业执照存在的不同版本的字段分布差异以及执照图片质量差等问题,其定制研发的OCR检测识别引擎,识别准确率达到95%以上。
腾讯OCR技术已通过腾讯云对外开放,不仅本身不断优化升级,还广泛开展内外部合作,依托技术赋能实现行业智能化改革,减轻各行业合作伙伴的业务支撑压力,企业员工处理事务也变得轻松,效率得到提升,最终也将受惠于每一个人。