2018机器阅读理解技术竞赛报名即将截止 汇集全球高校AI技术人才

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

由中国中文信息学会(CIPS)、中国计算机学会(CCF)和百度公司联手举办的“2018机器阅读理解技术竞赛”已于2018年3月1日正式启动,获胜团队将分享总额10万人民币的奖金,并将在第三届“语言与智能高峰论坛”上进行技术交流和颁奖。

自开启报名通道后,大赛已收获了海内外800多支队伍的积极响应。目前,大赛仍在火热报名中。截至3月25日,本届竞赛已有全球824个队伍和个人注册报名,其中333支团队来自海内外149所高校和科研院所、112支团队来自78家企业。据统计信息,全国211高校中将近一半的高校有研究团队报名参赛,成为参赛队伍的主力。参赛的国际队伍有来自美国、英国、加拿大、新加坡等十余个国家的109个团队及个人,汇集了全球的AI技术优质人才。

3月31日,大赛报名将会截止,同时对报名者开放全部训练数据,参赛者可登录2018机器阅读理解技术竞赛官网下载,并开启竞赛任务。还未报名的个人及团队,请在规定时间内登录竞赛官网报名参赛,与海内外众多AI人才一较高下。3月31日报名的队伍当天即可下载新数据集。


机器阅读理解的任务就是让机器阅读文本,回答和阅读内容相关的问题,其中涉及到语言理解、知识推理、摘要生成等复杂技术,极具挑战。在当今 互联网 应用中,智能搜索、内容推荐、语音助手与智能客服等领域的发展,都大量依靠于机器阅读理解阅读真实问题、真实互联网材料,给出完整答案的AI能力。从海量真实数据中训练AI,是自然语言处理和人工智能领域的重要前沿课题。百度与CIPS、CCF联合举办2018机器阅读理解技术竞赛并开放数据集,旨在为研究者提供学术交流平台,进一步提升机器阅读理解技术的研究水平,并希望更多研究者能够利用数据集产出更好更优质的机器阅读理解模型,推动语言理解和人工智能领域技术研究和应用的发展。

为此,本次竞赛中将提供面向真实应用场景的大规模中文阅读理解数据集。数据集包含来自百度搜索的30万个真实问题,每个问题对应5个候选文档文本,以及人工撰写的优质答案。竞赛任务是对于给定问题q及其对应的文本形式的候选文档集合D=d1, d2, ..., dn,要求参评阅读理解系统自动对问题及候选文档进行分析,输出能够满足问题的文本答案a。为了便于参赛选手快速了解竞赛任务,竞赛还提供了两个开源的阅读理解基线系统,并采用ROUGH-L和BLEU作为评价指标。

有数据显示,中国人工智能人才缺口超过500万,在自然语言处理技术成为人才竞争核心领域之一的今日,百度通过开展机器阅读理解技术竞赛、百度之星开发者大赛、PaddlePaddle AI大赛等多个人工智能行业竞赛并开放海量优质AI数据资源,正是希望携手并赋能AI行业的优质人才,进一步推动人工智能领域的技术交流和发展,为研究者提供强大的学习驱动力与创造力,培养与成就更多中国人工智能领域的精英技术人才,最终持续推进中国AI产业的发展,让越来越多的中国面孔亮相于人工智能领域的世界舞台。

同时,百度诚邀所有对AI有兴趣的技术人才了解和关注百度AI数据集,已公开的阅读理解数据集可以登陆百度AI数据集官网自由下载,并通过平台提交算法模型,根据测试结果进行系统效果验证。除了阅读理解数据集,百度AI公开数据集计划BROAD(Baidu Research Open-Access Dataset)还发布了视频和图像数据集,更多数据集参见百度AI数据集官网。

未来,百度将继续在AI人才培养中发挥重要作用,助力产学研各方开展研究,提升我国在机器阅读理解技术领域的影响力,让人才成为AI领域持续领跑的强力引擎。

随意打赏

全球ai领域人才报告
提交建议
微信扫一扫,分享给好友吧。