有一种题型叫“阅读理解”科大讯飞AI研究院揭秘机器阅读理解背后的故事
在咱们长大成才的过程中,在那些寒窗苦读的学生时代,你一定碰见过的一种题型叫“阅读理解”。
而且我猜,你一定并不太喜欢它。分值高、审题难,还要融会贯通的进行主观陈述和作答。
如果把这样的“烦恼”交给机器,以人工智能高阶的表现,是不是轻松化解?
就着阅读理解这事,科大讯飞AI研究院副院长王士进和研究主管崔一鸣娓娓道来、解疑答惑。他们的团队已连续在机器阅读理解的比赛上摘得全球桂冠。
有些路有点远 也要走
今年2月10日,科大讯飞又拿奖了。
在SemEval 2018国际语义测评大赛的机器阅读理解评测任务中,哈工大讯飞联合实验室(HFL)荣获桂冠。这是该实验室在机器阅读理解领域权威评测大赛SQuAD中,半年内连续三度刷新世界纪录后,在机器阅读理解领域的又一重大突破。
“给定一个日常生活场景的描述文本及相关问题,我们需要利用常识和知识让机器从候选答案中挑选出正确答案。”这其中利用了机器阅读理解的相关技术,“我们把从融合式层叠注意力系统分拆的技术,应用到其他自然语言处理任务中。”
阅读理解先审题后答题,这其中蕴含了一整套逻辑理解的关系,人处理起来都不太容易、机器如何拥有这项能力?“其实人和机器的解题过程有区别。”
崔一鸣介绍,人在审题和做题的时候通常要结合自身已掌握的常识和知识,并且综合全文的信息做进一步归纳、推理,这个过程相对较为多元化。而对于目前的机器来说,首先需要“阅读”大量的篇章和问题,并且计算出篇章、问题之间语义级别的匹配程度,从而更好的抽取出与解题相关的内容。“所以对于机器来说,更能够答好之前见过的问题,而缺乏一些多元化、综合解题的能力。”
说得坦率些,虽然目前机器在某些阅读理解数据集上的水平超过了人类,但这并不能表明“机器打败了人类”。“现在的技术距离通用型人工智能其实还很远,机器还无法能够模拟很多人类的智能。”王士进解释,通用性不够强、需依赖大量有标注的数据,都是目前人工智能技术的局限性。
让机器能理解会思考,让机器具备真正的推理能力,其实还有很长一段路要走。“理论框架上必须进行突破,而是不简单的升级。”王士进说,首先机器要能从海量数据学会推理、掌握知识和常识,其次还需要机器从小样本数据上学会同样的事情。
有些结果情理之中 意料之外
因为有这样的研究目标,拿奖对于科大讯飞AI研究院而言,似乎是水到渠成。“SemEval2018上夺冠从时间上是意料之外,但从技术角度来说也是情理之中。”
事实上,准备这项大赛,团队只用了1个半月左右。“因为当时在工程项目上需要进行技术攻关,偶然了解到今年这项比赛中有机器阅读理解的任务,便抽出部分时间来参与。模型设计花费了1-2周,后续还做了参数调整和效果优化。”崔一鸣坦言,对于新任务团队本也没有十足的夺冠把握,只是从技术积累看有希望。
“冠军不是目标,只是我们技术的试金石,体现的是核心技术的领先优势。”坐拥机器阅读理解领域的多项世界纪录和世界冠军,该团队显得霸气亦谦虚。
而今,在被誉为人工智能领域皇冠上明珠的机器阅读理解大赛中,除了几家“常委”级的研究机构之外,还有来越多的 科技 公司、甚至 互联网 公司、 创业 公司加入,“这样有助于促进该领域技术的进步。”
对于科大讯飞,如果参赛却没有拿到冠军,是不是意味着失败?“胜败乃兵家常事,技术的发展是螺旋式、曲折式的上升发展,讯飞有耐心去包容这样的‘失败’。”
也许正如那个道理:任何领域都没有常青树。技术上亦如此,为了获得持续发展的源动力,科大讯飞不仅自己拿冠军,还在帮助别人拿第一。
崔一鸣透露,2016年科大讯飞发布了首个中文填空型阅读理解数据集PD&CFT。2017年,科大讯飞携手中国中文信息学会计算语言学专委会(CIPS-CL)共同举办了首届“讯飞杯”中文机器阅读理解评测(CMRC 2017)并与全国计算语言学会议(CCL)共同召开,为相关学者提供了一个良好的沟通平台。“今年,我们会继续举办第二届“讯飞杯”中文机器阅读理解评测(CMRC 2018),和更多研究人员共同推动中文机器阅读理解的研究发展。”
有些应用有瑕疵 不碍事
从某种意义而言,让机器能“阅读理解”是人工智能向着高阶发展的尝试。能理解、会思考,认知智能主要体现在人机交互和行业应用上,“认知智能的发展和逐步成熟,会使得人机交互逐渐便捷有效,会学习和固化行业专家和行业大数据的经验,对各个行业产生颠覆式的创新。”
相关的应用已经开始。王士进说,目前讯飞在多个应用领域使用自然语言处理等技术促进产品帮助人类。
比如,讯飞人工智能机器人是全球第一次参加并通过国家执业医师资格考试笔试评测,并拿到456分、超过了95%的人类考生,在全世界首次做到了让人工智能具备当全科医生的潜质。还比如,通过人工智能的知识图谱和习得顺序分析可以精准分析每个孩子的学习情况,从而实现因材施教,有针对性的布置个性化作业,还能大幅降低无效重复学习时间。再比如,人工智能辅助审判刑事案件,把公检法证据贯穿之后,可以自动分析有没有证据缺失和自相矛盾,可以自动地进行立案推送和辅助判断,极大地提升了一线的断案水平,使得法治中国因为人工智能从而有了更好地保障和推动。
对语言本身的处理和应用也有更广的尝试。“讯飞听见会议系统可实时将语音转写成文字,不仅有中文还有英语;讯飞翻译机也已具备了7种语言的互译功能,未来还将开发更多国家语言翻译功能,布局相关语种的语音识别技术、语音合成技术、机器翻译技术。”
有没有不太满意的地方呢?瑕疵肯定存在,王士进以智能阅卷技术的应用举例,坦言计算机评分也存在错误的情况,但这并不妨碍研发、应用的大势,“未来,随着人工智能技术的发展,机器可以自动学习教师的评卷方法,除了开放式作文,在其他科目、甚至政史地问答题等试题的批阅中,机器都可以自动阅卷。”如此将大大解放教师们时间和精力,“他们将投入到对教学方法、教学手段等创造性工作的研究中,相学生们也会因此获得更好、更全面的教育。”
所以,“阅读理解”只是开始,包括讯飞AI研究院在内,攻克它只是核心技术研究上的一点突破,更大的意义在于构建研究生态和让研究应用真正发挥价值。