Arena Elo 基准测试：谷歌Gemini 1.5 Pro性能媲美 OpenAI GPT

砍柴网 • 10月前扫码分享

5 月 30 日消息，谷歌在 I / O 2024 开发者大会上，宣布将 Gemini 1.5 Pro 上下文窗口增加至 200 万个tokens， 那么 Gemini 1.5 Pro 性能究竟有多强悍？

根据 LMSYS Org 公布的总排行榜对比，通过 Arena Elo 系统的测量，Gemini-1.5-Pro-API-0514 和 Gemini-Advanced-0514 都接近 GPT-4o。

Arena Elo 基准测试：谷歌Gemini 1.5 Pro性能媲美 OpenAI GPT

上述两款模型在中文方面的表现也非常游戏，Gemini 1.5 Pro 在“hard prompts”类别中也非常接近。

Arena Elo 基准测试：谷歌Gemini 1.5 Pro性能媲美 OpenAI GPT

IT之家注：Arena Elo 系统通过让用户匿名投票决定哪个模型在随机对战中表现更好来衡量大型语言模型（LLMs）的技能，并像国际象棋中的 Elo 系统一样更新用户的评分，整体而言更加客观。

【来源： IT之家】

随意打赏

谷歌因滥用搜索市场“近乎垄断地位”在英国面临50亿英镑诉讼

i黑马 • 3分钟前

谷歌在英国面临超过50亿英镑（约合66亿美元）的潜在赔偿诉讼，指控这家美国科技巨头滥用其在在线搜索市场的“近乎垄断地位”推高广告价格。周三（4月17日）在英国竞争上诉法庭提起的集体诉讼称，谷歌通过限制竞争对手搜索引擎来巩固其市场主导地位，使自己成为在线搜索广告的唯一可行选择。该诉讼由竞争法学者奥·布鲁克代表2011年1
谷歌DeepMind开发DolphinGemma AI模型，助力海豚“语言”研究

砍柴网 • 2天前

4月15日消息，谷歌旗下的AI研究实验室谷歌DeepMind今日宣布，成功开发出一款名为DolphinGemma的AI模型，旨在助力科学家深入研究海豚的“语言”，更好地理解海豚的沟通方式。据IT之家了解，DolphinGemma是基于谷歌开放的Gemma系列模型构建的，其训练数据来源于专注于研究大西洋斑点海豚
谷歌安卓和Pixel手机团队被曝裁员数百人

砍柴网 • 3天前

4月14日消息，据《The Information》上周五报道，一位了解情况的人士透露，Alphabet旗下的谷歌在其平台和设备部门裁员数百人。报道称，该部门（IT之家注：包括Android平台、Pixel 手机和Chrome浏览器等应用）的裁员，发生在谷歌1月份向该部门员工发出要约之后。
谷歌Pixel 9a手机支持电池健康度辅助功能：随老化进程分阶段调整最大电压

砍柴网 • 3天前

4月14日消息，谷歌Pixel手机帮助中心页面显示，该企业新推出的Pixel 9a智能手机支持一项名为“电池健康度辅助功能”的独占新特性，该功能可帮助稳定电池性能和老化速度。 “电池健康度辅助功能”会随着电池老化自动管理Pixel 9a电池的长期健康状况和性能。此软件将从200个充电周期开始分
谷歌诠释Pixel 9a手机设计思路：相机“圆顶”方案，探索美学新方向

砍柴网 • 4天前

4月12日消息，科技媒体 Android Authority今天（4月12日）发布博文，报道称谷歌回应Pixel 9a 手机相机模块灵感来自Pixel Watch的“水滴造型”，内部将其称为“圆顶”设计。谷歌Pixel 9a手机发布后，但其设计选择引发热烈
谷歌Gemini AI新功能Circle Screen曝光：圈选截屏特定区域，实现精准搜索

砍柴网 • 4天前

4月12日消息，科技媒体 Android Authority昨日（4月11日）发布博文，报道称谷歌计划发布Circle Screen功能，支持用户圈选屏幕部分内容，实现精准搜索。谷歌近期在Instagram上发布了一段展示Gemini屏幕共享功能的视频，意外透露了一项未公开
谷歌Pixel Watch 4智能手表渲染图首曝：收窄边框、更大电池、新增双按键，有望支持无线充电

砍柴网 • 4天前

4月12日消息，科技媒体 91Mobile昨日（4月11日）发布博文，分享了一组渲染图片，展示了谷歌Pixel Watch 4智能手表。作为Pixel Watch 3的继任者，新款手表将升级设计和性能，带来更卓越的使用体验。外观方面，Pixel Watch 4延续了前代Pi
Gemini 大模型逆袭，给了 Google Cloud「AI 基建」的勇气

极客公园 • 5天前

北京时间 4 月 10 日凌晨，Google Cloud Next 2025 正式揭开序幕。如果用「AI 届的苹果发布会」来形容每年的英伟达硬件发布会，那「AI 届的 CES」或许更适合用来形容今年的 Google Cloud Next；虽然同样令人兴奋，但每一个来到现场的人都带着自己的问题，现场随处可见各种务实的交
终究是Google和Anthropic，扛下了连接一切Agent的所有

虎嗅网 • 6天前

Google Cloud Next'25大会上，Google“杀疯了”，而与其说今年的大会是一场按部就班的发布会，不如看作是Google Cloud在全球AI军备竞赛中的一次表态。面对亚马逊AWS和微软Azure这两大巨头的挤压，尽管手握DeepMind等顶尖AI研究力量，Google Cloud在市场份额上
谷歌承诺终止汽车服务和地图相关限制竞争措施，德国反垄断机构结束调查

i黑马 • 6天前

德国反垄断机构“联邦卡特尔局”4月9日发布声明称，谷歌承诺将终止与谷歌汽车服务和地图平台有关的多项限制竞争措施，该机构结束诉讼程序。德国反垄断机构此前曾对谷歌车载地图与信息娱乐系统捆绑的形式表示担忧，称这可能会阻碍竞争对手单独销售类似服务的机会。文章评价匿名用户发布发布

提交建议