谷歌人工智能做高中数学 40题只对14题

砍柴网 • 6年前扫码分享

在围棋这个人类一直以来占据着优势的项目里，谷歌旗下DeepMind开发的人工智能（AI）AlphaGo已经先后击败了柯洁和李世石两位顶尖棋手。但说来难以置信，DeepMind开发的AI能打败人类世界棋王，却无法通过英国高中的数学考试。

《分析神经模型的数学推理能力》

4月2日，谷歌旗下的DeepMind团队公布了一份名为《分析神经模型的数学推理能力》的研究报告（Analysing Mathematical Reasoning Abilities of Neural Models）。在这项研究中，团队让AI接受一项包含了算术、几何、概率和测量的数学测试，考题有 40 题，难度大约是英国高中数学的程度。

谷歌人工智能做高中数学 40题只对14题 DeepMind给出的40道英国高中数学题

不过，在这40道高中难度的数学题中，拥有强大通用算法和远超人类计算能力的人工智能，却只答对了14题，正确率只有35%，是实打实的不及格。

值得一提的是，在AI参加测试以前，团队已经为其做好了充足训练。据DeepMind介绍，他们为AI建立了一个包含200万道题目的题库，涵盖了算术、代数、概率、微积分等各种题型。

同时，团队也派出了循环神经网络（RNN）和Transformer两大当下性能最先进的模型参与测试。

为什么人工智能无法答对高中数学题呢？

原来，最主要的原因是AI“看不懂”题目。DeepMind旗下的AI虽然已经拥有了极强的机器翻译能力，但依然抵不住数学问题的复杂性和语言多样性的压力。

对人类而言，要解决数学问题，要应用到的不只有计算能力，还有各种各样的认知技能。比如理解题干，需要将文字或图标转换为算术运算符。

而对于依赖大量数据分析来寻求解决问题规律的AI而言，数学语言的复杂性是一座难以逾越的高山。

其次，AI“举一反三”的能力，也无法与人类一较高下。它只能处理一些内部存储的问题，无法超越已有的环境去理解新的东西。

而人类在解决数学问题时，会进行推理，从已知的公理中找到最佳策略，而在具体的运算过程中，必须利用工作记忆来完成运算。

据DeepMind研究人员总结，现阶段AI在推论的能力上，还不及人类。在解答问题时，人脑动用了多种认知能力，包括将符号分类、演算、运用工作记忆来储存中间值、还要运用学到的规则或定理等。

相反，AI则擅长模式比对、机器翻译和强化式学习，但弹性远不及人脑。它们不太能将事物推论到已有经验的环境外，更无法处理刻意乱输入的资讯。

不过，虽然目前AI还无法当数学老师，但他们已经称霸了相当多的领域。除了围棋以外，DeepMind旗下的AI又在游戏《星际争霸2》（StarCraft II）的测试赛中，5-0横扫世界顶尖职业选手。

【来源：观察者网】

随意打赏

谷歌人工智能alphago 谷歌的人工智能系统谷歌人工智能平台谷歌围棋人工智能谷歌人工智能开源谷歌人工智能手机谷歌下载谷歌空间

全世界都在“围剿”谷歌

虎嗅网 • 4分钟前

谷歌正遭遇其有史以来最严峻的生存危机。据媒体报道，美国当地时间周一，在谷歌反垄断案件补救措施听证会上，美国司法部检察官大卫·达尔奎斯特表示，谷歌需要被施加强有力的措施，以防其利用人工智能产品进一步巩固其在网络搜索领域的主导地位，该律师表示，“我们正处于一个转折点。法院有机会纠正当代互联网的垄断，并在未来几十年恢复竞争。
中国软件行业协会NCT编程考级2025年4月考圆满收官，新增人工智能教育测评体系

砍柴网 • 1分钟前

2025年4月19日至20日，由中国软件行业协会主办的NCT青少年编程能力等级测试成功举办。本次考试共设55个科目场次，涵盖图形化编程（Scratch/Kitten/Blockly/Nemo等工具)、Python/C++编程、机器人编程（创意搭建/开源硬件/创客积木/益智拼搭）、人工智能编程专项测评、信息学C++专项测
谷歌Google Photos照片应用上线Ultra HDR编辑，普通照片一键升级

砍柴网 • 1天前

4 月 21 日消息，谷歌的第一方照片应用 Google Photos 正在逐步上线一项全新的照片编辑功能“Ultra HDR”，这一功能最早可追溯至去年 9 月。而据外媒 Android Authority 今日报道，部分用户称自己已经开始接收到该功能的推送，用户可在照片拍摄完成后，将普通照片升级
谷歌反击：不服垄断裁决，誓言上诉

砍柴网 • 3天前

4 月 19 日消息，美国联邦地区法官 Leonie Brinkema 于 2025 年 4 月 17 日裁定，谷歌在广告市场的主导地位构成非法垄断。谷歌对此表示部分认可裁决结果，但同时宣布将对不利部分提起上诉。Brinkema 裁定谷歌在广告市场的控制力已构成非法垄断，她指出，谷歌通过剥夺竞争对手
高校发力人工智能人才培养，南京大学、浙江大学陆续与阿里云推进人才培养计划

砍柴网 • 3天前

今年全国两会期间,人工智能成为热议的焦点,人工智能作为新一轮科技革命的核心驱动力,已成为推动社会进步和经济发展的关键力量。多个高校正积极通过课程创新、跨学科融合、加强产学研深度融合等方式,积极探索人工智能人才培养新模式。近日,《科教融汇•产教融合:双轮驱动服务国
OpenAI最新的人工智能模型可以“用图像思考”，理解图表和草图

i黑马 • 3天前

OpenAI发布了其最新的人工智能模型，据称该模型可以理解上传的图像，如白板、草图和图表，但它们质量很低。OpenAI的主要新推理模型被称为o3，该公司同时发布了一个较小的模型，名为o4-mini。在此之前，OpenAI的第一个推理模型o1于去年9月首次亮相，该模型专注于解决复杂问题，并分多个步骤仔细考虑答案。文章评价
上海人工智能实验室开源多模态大模型书生·万象3.0

i黑马 • 4天前

上海人工智能实验室（上海AI实验室）升级并开源了通用多模态大模型书生·万象3.0（InternVL3）。通过采用多模态预训练和后训练方法，InternVL3 多模态基础能力全面提升，在专家级基准测试、多模态性能全面测试中，10亿~780亿参数的全量级版本在开源模型中性能均位列第一，同时大幅提升了图形用户界面（GUI）智
谷歌因滥用搜索市场“近乎垄断地位”在英国面临50亿英镑诉讼

i黑马 • 5天前

谷歌在英国面临超过50亿英镑（约合66亿美元）的潜在赔偿诉讼，指控这家美国科技巨头滥用其在在线搜索市场的“近乎垄断地位”推高广告价格。周三（4月17日）在英国竞争上诉法庭提起的集体诉讼称，谷歌通过限制竞争对手搜索引擎来巩固其市场主导地位，使自己成为在线搜索广告的唯一可行选择。该诉讼由竞争法学者奥·布鲁克代表2011年1
投资人工智能的四个原则

虎嗅网 • 5天前

本文来自微信公众号：阿朱说，作者：吕建伟，题图来自：AI生成（1）人工智能企业都是小而精的特种部队。就连世界上最大的人工智能公司OpenAI才170多人。因为人工智能的核心是模型，而不是功能。所以如果有许多程序员，那就是伪人工智能公司。（2）人工智能企业都是极消耗数据和算力的。如果数据也不海量，也没
金山云宣布增发18,500,000股ADS 加码基础设施升级及人工智能业务发展

砍柴网 • 5天前

2025年4月16日，金山云宣布，将公开发行18,500,000股美国存托股（ADS），每ADS代表该公司15股普通股。同时，金山云还授予ADS承销商购买额外美国存托股的30天选择权。并且，为了方便港美股两地投资者认购，投资者可以选择在此次发行中以普通股代替ADS在港交所进行交易。
Check Point凭借人工智能安全平台荣获Miercom评选榜第一

砍柴网 • 5天前

Miercom 的独立测试表明，Check Point Infinity Platform 在威胁防御、零信任架构和人工智能驱动的网络防御方面领先于顶级安全供应商Check Point软件技术有限公司近日宣布，其Infinity平台在2025年度Miercom评估中获评全球最佳AI驱动网络安全平台。该报告验证了Chec
深度迈进人工智能新纪元，标普云正式更名标普智元！

砍柴网 • 6天前

在科技变革风起云涌的当下，企业的战略转型与升级成为时代发展的印记。2025 年 4 月 11 日，深圳标普云科技有限公司正式更名为深圳标普智元科技有限公司，这一举措标志着其在人工智能领域的深度迈进，以全新姿态迎接人工智能新纪元。以下是来自标普智元总裁杨蜀的信件，为我们揭示此次更名背后的故事
全球化战略再提速！阿丘科技亮相2025日本东京人工智能展

砍柴网 • 6天前

4月15日至17日, 日本东京人工智能展 (AI EXPO TOKYO 2025)春季展将在东京国际展览中心(Tokyo Big Sight)盛大启幕。作为日本规模最大、影响力最广的AI领域专业展会,2024年日本人工智能展春季展会便已吸引了约300家企业参展,接待了
谷歌DeepMind开发DolphinGemma AI模型，助力海豚“语言”研究

砍柴网 • 7天前

4月15日消息，谷歌旗下的AI研究实验室谷歌DeepMind今日宣布，成功开发出一款名为DolphinGemma的AI模型，旨在助力科学家深入研究海豚的“语言”，更好地理解海豚的沟通方式。据IT之家了解，DolphinGemma是基于谷歌开放的Gemma系列模型构建的，其训练数据来源于专注于研究大西洋斑点海豚
马斯克：一种用于完全自动驾驶的通用人工智能解决方案将出现

i黑马 • 7天前

4月14日消息，特斯拉CEO埃隆·马斯克发文表示：“很快，将首次出现一种通用的、纯粹的人工智能解决方案，用于实现完全自动驾驶。仅需摄像头以及搭载特斯拉人工智能软件的特斯拉人工智能芯片。”文章评价匿名用户发布发布
谷歌安卓和Pixel手机团队被曝裁员数百人

砍柴网 • 8天前

4月14日消息，据《The Information》上周五报道，一位了解情况的人士透露，Alphabet旗下的谷歌在其平台和设备部门裁员数百人。报道称，该部门（IT之家注：包括Android平台、Pixel 手机和Chrome浏览器等应用）的裁员，发生在谷歌1月份向该部门员工发出要约之后。
谷歌Pixel 9a手机支持电池健康度辅助功能：随老化进程分阶段调整最大电压

砍柴网 • 8天前

4月14日消息，谷歌Pixel手机帮助中心页面显示，该企业新推出的Pixel 9a智能手机支持一项名为“电池健康度辅助功能”的独占新特性，该功能可帮助稳定电池性能和老化速度。 “电池健康度辅助功能”会随着电池老化自动管理Pixel 9a电池的长期健康状况和性能。此软件将从200个充电周期开始分
谷歌诠释Pixel 9a手机设计思路：相机“圆顶”方案，探索美学新方向

砍柴网 • 10天前

4月12日消息，科技媒体 Android Authority今天（4月12日）发布博文，报道称谷歌回应Pixel 9a 手机相机模块灵感来自Pixel Watch的“水滴造型”，内部将其称为“圆顶”设计。谷歌Pixel 9a手机发布后，但其设计选择引发热烈
谷歌Gemini AI新功能Circle Screen曝光：圈选截屏特定区域，实现精准搜索

砍柴网 • 10天前

4月12日消息，科技媒体 Android Authority昨日（4月11日）发布博文，报道称谷歌计划发布Circle Screen功能，支持用户圈选屏幕部分内容，实现精准搜索。谷歌近期在Instagram上发布了一段展示Gemini屏幕共享功能的视频，意外透露了一项未公开
谷歌Pixel Watch 4智能手表渲染图首曝：收窄边框、更大电池、新增双按键，有望支持无线充电

砍柴网 • 10天前

4月12日消息，科技媒体 91Mobile昨日（4月11日）发布博文，分享了一组渲染图片，展示了谷歌Pixel Watch 4智能手表。作为Pixel Watch 3的继任者，新款手表将升级设计和性能，带来更卓越的使用体验。外观方面，Pixel Watch 4延续了前代Pi

评论