美团将主办 ICDAR2019「中文门脸招牌文字识别」比赛,并公开首个真实场景招牌图像数据集
雷锋网 AI 科技评论按: 国际文档分析与识别国际会议(International Conference on Document Analysis and Recognition,ICDAR)是由国际模式识别学会(IAPR)组织的专业会议之一,其专注于文本领域的识别与应用,目前已经是全球文档图像分析识别领域公认的权威学术会议。该会议每两年举办一次, 今年的 ICDAR 2019 将于 9 月 20-25 日在澳大利亚悉尼举办。 雷锋网 (公众号:雷锋网) 雷锋网
ICDAR 的一大重头戏便是「鲁棒文本阅读竞赛」(Robust Reading Competitions),该比赛于 2003 年设立,致力于提高自然场景的文本检测和识别水平,至今已有来自 89 个国家的 3500 多支队伍参与。
今年的 ICDAR 2019 上,美团将联合国内外知名科研机构和学者主办「中文门脸招牌文字识别」比赛(ICDAR 2019 Robust Reading Challenge on Reading Chinese Text on Signboards)。据悉,美团将挑选出非常能代表中文特点的餐饮商家的门脸招牌图片来组织竞赛,这些招牌上的文字存在中文特有的设计和排版,同时也兼有自然场景文字识别中普遍存在的拍照角度、光照变化等干扰因素。值得一提的是,本次比赛所使用的数据集,便是美团即将公开的业界首个真实场景招牌图像数据集。
比赛的具体信息如下:
组织者
美团:王栋、张睿、刘曦、周永生
华中科技大学:白翔、廖明辉、杨明锟
Microsoft (Redmond,USA):Baoguang Shi
Nanyang Technological University (Singapore):Shijian Lu
Computer Vision Centre,UAB(Spain):Dimosthenis Karatzas
IIIT Hyderabad(India):C. V. Jawahar
数据集介绍
美团本次公开的数据,由遍布全国的市场人员所拍摄的众多门脸招牌图片组成,共 25000 张。每张图片是由完全独立的不同个人、采用不同设备、在不同地点和不同时间和不同环境下所拍摄的不同商家的门脸招牌图片。该数据集以中文文字为主,也包含一定数量的英文和数字:英文和数字的占比介于 10% 和 30% 之间。标注内容比较完备,每张图片均标注了单个字符的位置和文本,以及各字符串的位置和文本,是难得的用于研发和评估中文识别技术的数据集。这 25000 张图片中,20000 张图片将用于训练,2000 张将用于验证,3000 张将用于测试。
数据集示例
比赛内容
本次门脸招牌识别,共定义了 4 个任务,分别如下:
TASK 1:招牌端到端文字识别
TASK 2:招牌文字行定位
TASK 3:招牌区域内单字识别
TASK 4:招牌区域内字符串识别
奖励方式
-
颁发奖状:按照最终成绩进行排名,以从高至低顺序依次选取前三名,颁发奖状。
-
比赛奖金:从高至低顺序选取前三名参赛方为学校及科研院所等非盈利机构。
奖金具体设置如下:
重要日期
2019 年 3 月 1 日:报名通道开放
2019 年 3 月 18 日:训练数据集开放
2019 年 4 月 15 日:测试数据集分批开放
2019 年 4 月 16 日:提交通道开放
2019 年 4 月 30 日:提交截止日期
2019 年 5 月 10 日:比赛最终报告提交
2019 年 9 月 20 日:ICDAR 2019 大会召开
参赛报名
报名链接地址: https://rrc.cvc.uab.es/?ch=12
报名链接二维码:
感兴趣的小伙伴们可以通过以上两种方式报名参加比赛,一起瓜分 15000 美金!
信息来源:美团
。