赶超百度微软登顶 MSMARCO，猿辅导机器阅读理解超过人类水平

雷锋网 • 6年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

雷锋网 (公众号：雷锋网) AI 研习社消息，近日，猿辅导超过了百度、微软，登顶微软 MSMarco（Microsoft Machine Reading Comprehension）机器阅读理解测试排行。

据猿辅导透露，此次提交的 MARS（Multi-Attention ReaderS）模型，采用层叠式的注意力机制在多候选文档采样出多个候选答案区域，并在此基础上使用交叉投票模型，优化最终的答案。

赶超百度微软登顶 MSMARCO，猿辅导机器阅读理解超过人类水平

图：MSMarco 排名情况

MS MARCO 是微软发布的一套 10 万个问答组成的数据集，人工智能领域的研究人员可用它来构建能够与真人相媲美的问答系统。猿辅导 NLP 团队上传的 MARS 模型给出的答案，在官方评测指标（Bleu-1 和 Rouge-L）上测试得分为：49.72、48.02，而人类基准为 47、46，这不仅在 MSMARCO 排行榜上首次出现，在全球阅读理解任务上也是首次。

另外，猿辅导的模型在 semEval(国际语义评测)上的阅读理解 task 上获得了第二名，而此前猿辅导曾在 SQUAD 数据集上，单模型第三。

猿辅导应用研究团队成立于 2014 年年中，一直从事深度学习在教育领域的应用和研究工作。团队成员均毕业于北京大学、清华大学、上海交大、中科院、香港大学等知名高校，大多数拥有硕士或博士学位。

赶超百度微软登顶 MSMARCO，猿辅导机器阅读理解超过人类水平

图：MSMarco 官方推文

为什么要做机器阅读理解？猿辅导表示：「从公司组建起，我们就有自己的应用研究部，AI 做为教育未来应用的底层技术，我们公司也在着重打造自己在这方面的能力，包括猿辅导在线课程在内的公司各项业务，也都享受着 AI 技术带来的推动和变革。」

机器阅读理解、语音识别、手写识别、图像识别等技术，分别被应用在了猿辅导的在线辅导课程，小猿搜题、小猿口算、斑马英语等等产品中，诸如小猿搜题的搜题功能，英文作文的手写识别及打分，小猿口算的拍照批改，斑马英语的绘本朗读打分等等。

不过，机器阅读理解只是猿辅导众多 AI 技术方向中的一支，该公司一直在技术层面上做更多的尝试，研究方向涵盖了图像识别，语音识别、自然语言理解、数据挖掘、深度学习等领域。对于机器阅读理解的研究，猿辅导希望将其应用在教育行业中，例如高考作文的自动批改，阅读理解的自动出题等，语文题目的自动作答等。

。

赶超百度微软登顶 MSMARCO，猿辅导机器阅读理解超过人类水平

随意打赏

微软阅读理解数据集机器阅读理解后发赶超阅读理解

微软敲定Win11全新快捷键！Alt+Space启动Copilot

砍柴网 • 4分钟前

1月10日消息，据媒体报道，Windows 11似乎已经敲定Copilot应用程序将采用新的快捷键组合，即Alt + Space，而非之前普遍预期的Win + C（Cortana快捷键）。其实自2024年12月推出以来，Copilot原生应用一直支持Alt+Space快捷键启动。不
Linux基金会谷歌微软 Meta Opera成立Chromium浏览器支持者联盟

砍柴网 • 6分钟前

1 月 10 日消息，Linux 基金会今日宣布推出基于 Chromium 的 Bowsers 支持者计划。Linux 基金会将作为中立平台托管“Chromium 浏览器支持者”基金。除谷歌提供主要资金外，Meta、微软和 Opera 也加入了该倡议，共同为基金提供支持。据介绍，“Chromium 浏览器支持者”联盟旨
微软发布 2025 年首套 Win10 / Win11 壁纸主题 Fluid Textures

砍柴网 • 12分钟前

1 月 10 日消息，Microsoft Design 官方今天（1 月 10 日）在 X 平台发布推文，宣布推出名为“Fluid Textures”的壁纸系列，为 2025 年带来一抹清新气息。该系列壁纸由微软与 3D 艺术家 George Stoyanov 合作创作，他曾为小米、
微软将针对各部门进行基于绩效的少量裁员，消息称影响“不到1%”员工

砍柴网 • 16分钟前

1 月 9 日消息，当地时间周三，微软通过 CNBC 确认，公司正在根据员工表现对各部门进行少量裁员。微软发言人在电子邮件中表示：“我们专注于高绩效人才，一直在帮助员工学习与成长。当员工未能达成预期表现时，我们会采取适当的行动。” 《商业内幕》在周二晚间报道了这一计划。知情人士透露，这次裁员
一心只想提高Win11使用率，前员工抨击微软对盗版Windows系统视而不见

砍柴网 • 46分钟前

1 月 10 日消息，前微软员工 @Barnacules 前天在 X 上发帖称，微软高层并不在意用户使用的到底是正版还是盗版系统（如 Windows 10 和 Windows 11），他们只想让更多人去用 Windows。根据 @Barnacules 的说法，即使有用户频繁举报 KMS 等获取 Windows 激活密钥
双揽工信部典型案例，百度大模型安全技术实践备受认可

砍柴网 • 6分钟前

近日,百度安全凭借在人工智能安全领域的创新实践和突出贡献,连续入选工业和信息化部两项典型案例:作为单独申报单位入选"2024年度网络安全技术应用典型案例"支持项目名单,同时名列151项"人工智能赋能新型工业化典型应用案例"之中。2024年度网络安全技术应用典型案例 & 人
微软PowerPoint嵌入视频支持SRT字幕

砍柴网 • 20小时前

1 月 9 日消息，微软公司于 1 月 7 日发布博文，邀请 Microsoft 365 用户，测试新版 PowerPoint 应用的字幕功能，主要支持导入 SRT 文件，方便听障人士、嘈杂环境或演讲者口音较重时，提升演示文稿的无障碍体验。IT之家注：整个操作非常简单，用户在 PowerPoint 中选择视频后，点击“
微软Win11 24H2文件管理器BUG频出，2025首更有望修复

砍柴网 • 20小时前

1 月 9 日消息，科技媒体 Windows Latest 今天（1 月 9 日）发布博文，报道称微软已确认在 Windows 11 24H2 系统中，文件管理器存在诸多问题，会在后续的更新中进行修复。地址栏重叠问题在全屏模式下，地址栏会与内容重叠，遮挡“Home”和“图库
微软开源140亿参数小语言AI模型Phi

砍柴网 • 20小时前

1 月 9 日消息，在 2024 年 12 月 12 日发布后，微软昨日（1 月 8 日）在 Hugging Face 平台上，开源小语言模型 Phi-4，感兴趣的开发者和尝鲜者可以下载、微调和部署该 AI 模型。IT之家注：该模型参数量仅为 140 亿，却在多个基准测试中表现优异，甚至超越了参数量更大的 Llama
微软官宣1月30日发布Surface“重大消息”！

砍柴网 • 20小时前

1月9日消息，微软在LinkedIn上发布了一则预告，宣布将于1月30日在纽约举行一场以人工智能为主题的活动，并在活动中发布来自Surface商用版的“重大消息”。据报道，微软有望在此次活动中推出搭载英特尔Lunar Lake处理器的Surface Laptop 7和Surface Pro 11商用版，这将是Surfa
微软承认必应AI图像生成器PR16“开倒车”，现回滚至PR13版本

砍柴网 • 20小时前

1 月 9 日消息，科技媒体 Windows Latest 昨日（1 月 8 日）发布博文，报道称微软必应图像生成器（Bing Image Creator）所用 DALL-E 3 模型升级至 PR16 版本后效果不佳，现已回滚至 PR13 版本。 IT之家曾于 2024 年
百度25周年李彦宏发全员信：AI应用将在2025年井喷

雷锋网 • 6天前

2025年1月1日，也是百度成立25周年，百度创始人李彦宏晚间发出全员信表示，技术创新是百度的核心竞争力，“25年来，我们始终走在技术的最前沿，始终相信技术创新才是百度的核心竞争力。” 信中写到，多年来，百度一直将超过20%资金投入研发，并不遗余力地尝试把最前沿的技术产品化，让更多人从中受益，只有规模化的应用，才能让技
不为人知的云计算「百亿增量」背后，谁最需要百度云？

雷锋网 • 10天前

“如果让你重回过去，在自动驾驶行业创一次业，你会怎么做？”面对雷峰网发出的这一设问，智驾创业者们给出了近乎一致的答案：在2023年之前，疯狂融资，守着金库什么都不做，广积粮，缓称王，耐心等到“端到端”来的那天。毕竟之前的几次技术路径几乎都被端到端推倒了重来，之前的领先优势也会因为新技术路径的切换而不复存在；等
百度这张AI成绩单，透出了2025年AI行业三大机会点 | 速途网

速途网 • 11天前

过去一年，国内基础大模型持续迭代，应用落地高速发展，激烈的大模型竞赛中，只有不断深耕技术能力才能跑出来。以百度为例，文心大模型日均调用量超15亿，自去年12月首次披露以来增长30倍。这一快速增长的趋势，亦是国内乃至全球大模型发展的一个缩影。近日，百度发了一张2024年AI成绩单，涵盖百度在大模型、智能体、AI应用等领域
百度百科短剧星耀计划启航：携手短剧创作者，共启新篇章

砍柴网 • 12天前

12月26日，百度百家合伙人年度盛典在西双版纳圆满举办，本次的主题为“正当红”，来自全国各地优秀的短剧演员及头部机构、制片人导演、内容从业者欢聚于此，共同探讨内容创作的未来趋势和短剧商业模式的多元拓展形式。短剧作为一种新兴的叙述形式，正以其短小精悍、节奏紧凑、主题鲜明和多
百度“AI放大招”走进中传，数字人李白成科普新亮点

砍柴网 • 15天前

近日,由百度公司主办的“AI放‘大’招——人类高质量AI开发者速成季”活动走进了中国传媒大学(简称“中传”),为该校师生带来了一场别开生面的“AI新奇一课”。此次活动不仅通过科普讲座与互动路演的方式,向学生们介绍了大模型的最新技术与应用场景,更以中传师生基于百度文心大模型开发的数字人少年李
百度大模型助力2024年码蹄杯程序设计大赛，全国高校学子展现卓越编程实力

砍柴网 • 18天前

备受瞩目的2024年码蹄杯全国大学生程序设计大赛已在北京顺利落下帷幕,颁奖典礼隆重举行。本次大赛由全国高等学校计算机教育研究会主办,百度公司、清华大学出版社、研究会职业教育分会、DCAC联合承办,量子位、软件导刊、AIGC青年大学生就业创业促进行动执委会作为支持单位。大赛旨在通过算法设计竞赛,激发学
百度职业院校专属项目“大国智匠”引领职业教育新范式

砍柴网 • 18天前

2024年,随着人工智能技术的飞速发展,职业教育迎来了前所未有的变革机遇。在这一背景下,百度公司凭借其深厚的技术积淀和前瞻性的战略布局,携手全国职业院校,共同推出了职业院校专属项目——“大国智匠”,旨在培养复合型人工智能技术人才,弥补国内AI人才缺口,推动职业教育高质量发展。为促进传统行业向智能化转型,满足智能型人才培
苹果AI合作方生变猜想：苹果需加快敲定合作，百度或需重新审视策略

砍柴网 • 19天前

苹果在中国的AI合作方可能生变。近日有消息称，苹果正在与腾讯和字节跳动商谈将两家公司的AI模型整合到在中国销售的iPhone中，但谈判仍处于早期阶段。就该消息的真实性，腾讯方面向记者表示：“不予置评”。目前字节跳动也暂无回应。值得注意的是，此前早有传闻称百度成为苹果的合作方，但不久前消息称双方在技术和
百度、腾讯或字节，谁能最终牵手苹果AI

虎嗅网 • 21天前

本文来自微信公众号：经济观察报，作者：任晓宁，题图来源：视觉中国 12月19日，据路透社报道，苹果公司（下称“苹果”）正与腾讯和字节跳动商谈，将其AI模型整合到在中国销售的iPhone中，该商谈还处于非常早期的阶段。苹果在国外的AI模型合作方是OpenAI，其功能在国内无法

评论