赶超百度微软登顶 MSMARCO,猿辅导机器阅读理解超过人类水平
雷锋网 (公众号:雷锋网) AI 研习社消息,近日,猿辅导超过了百度、微软,登顶微软 MSMarco(Microsoft Machine Reading Comprehension)机器阅读理解测试排行。
据猿辅导透露,此次提交的 MARS(Multi-Attention ReaderS)模型,采用层叠式的注意力机制在多候选文档采样出多个候选答案区域,并在此基础上使用交叉投票模型,优化最终的答案。
图:MSMarco 排名情况
MS MARCO 是微软发布的一套 10 万个问答组成的数据集,人工智能领域的研究人员可用它来构建能够与真人相媲美的问答系统。猿辅导 NLP 团队上传的 MARS 模型给出的答案,在官方评测指标(Bleu-1 和 Rouge-L)上测试得分为:49.72、48.02,而人类基准为 47、46,这不仅在 MSMARCO 排行榜上首次出现,在全球阅读理解任务上也是首次。
另外,猿辅导的模型在 semEval(国际语义评测)上的阅读理解 task 上获得了第二名,而此前猿辅导曾在 SQUAD 数据集上,单模型第三。
猿辅导应用研究团队成立于 2014 年年中,一直从事深度学习在教育领域的应用和研究工作。团队成员均毕业于北京大学、清华大学、上海交大、中科院、香港大学等知名高校,大多数拥有硕士或博士学位。
图:MSMarco 官方推文
为什么要做机器阅读理解?猿辅导表示:「从公司组建起,我们就有自己的应用研究部,AI 做为教育未来应用的底层技术,我们公司也在着重打造自己在这方面的能力,包括猿辅导在线课程在内的公司各项业务,也都享受着 AI 技术带来的推动和变革。」
机器阅读理解、语音识别、手写识别、图像识别等技术,分别被应用在了猿辅导的在线辅导课程,小猿搜题、小猿口算、斑马英语等等产品中,诸如小猿搜题的搜题功能,英文作文的手写识别及打分,小猿口算的拍照批改,斑马英语的绘本朗读打分等等。
不过,机器阅读理解只是猿辅导众多 AI 技术方向中的一支,该公司一直在技术层面上做更多的尝试,研究方向涵盖了图像识别,语音识别、自然语言理解、数据挖掘、深度学习等领域。对于机器阅读理解的研究,猿辅导希望将其应用在教育行业中,例如高考作文的自动批改,阅读理解的自动出题等,语文题目的自动作答等。
。