搞了半天AI的苹果,发现最佳方法是搞定谷歌
据彭博社记者 Mark Gurman 援引知情人士消息,苹果正在与谷歌进行谈判,希望将谷歌的 Gemini 集成到 iPhone 当中,为 iPhone 的软件提供 AI 相关的新功能。如果双方达成合作,这无疑会对当下人工智能领域的格局产生重大影响。此外,据透露,苹果还与 OpenAI 进行了讨论,考虑使用其模型。
苹果和之间竞合关系源远流长,iOS 和 Android 的直接竞争关系自不必说,合作方面,早在 2007 年,初代 iPhone 就预装了 Google Map 和 YouTube。在搜索方面,苹果和谷歌之间存在一项商业协议,确保谷歌成为苹果设备上 Safari 的默认搜索引擎。谷歌则需要向苹果支付其在 Safari 上获得的搜索收入的 36 %,估计每年在 150 亿美元至 200 亿美元之间。
苹果用户构成了谷歌搜索流量的一个重要部分,为此谷歌也支付了一笔巨额流量获取成本,谷歌 2023 财年的运营利润为 842.93 亿美元,这意味着谷歌把 20% 左右的利润交给了苹果。
不过,双方在搜索方面的协议已经成为美国和欧洲监管的焦点。美国政府指控这两家公司在移动设备上垄断搜索市场。双方辩解称,苹果认为谷歌的搜索质量优于竞争对手,而且在 iPhone 上切换默认搜索引擎很容易。
在 AI 上苹果和谷歌将达成怎样的协议尚未可知,不过可以确定的是,如果达成合作,可能会导致进一步的反垄断监管风险。
从押注 Vision Pro,到停止造车转向 AI,苹果正在寻找新的增长点和战略机遇。而在 AI 上具有先发优势的谷歌,也被微软支持的 OpenAI 甩开了一个身位,需要再次证明自己。 苹果和谷歌的联手,就像是要向微软发起一场反攻。
一、对 AI 热潮慢半拍的苹果,也要发AI手机了
近期,苹果放弃了长达十年的造车计划,并考虑将 2000 名员工转移到人工智能部门,这被视为苹果将全面转向 AI。此后,苹果先是曝出收购了 AI 初创公司 DarwinAI,DarwinAI 的数十名员工已经加入了苹果的 AI 部门,创始人 Alexander Wong 则担任苹果 AI 部门总监一职。新款 M3 MacBook Air 的发布,苹果更是直接称之为“最佳 AI 消费级笔记本电脑”。
上周末,苹果还发布了自研 MM1 大模型论文,这是一个最高有 30B 规模的多模态 LLM,超过一半的作者是华人。值得一提的是,苹果向来以其对产品和技术的高度保密而闻名,这次公布了MM1 的论文, 可能 预示着苹果在 AI 领域的研究和开发上采取了更加开放的策略。
MM1 目前还没有公测,官方也没有公布上线时间表,更像是苹果自研大模型的进展汇报,或许正是因为自研 LLM 的不顺利,才让苹果不得不选择考虑与谷歌进行合作。
我们什么时候能看到 iPhone 上的 LLM,可能要等到今年 6 月份 iOS18 的发布。根据内部人士的透露,生成式 AI 功能理论上将被集成到 Siri 和其他应用中。同时,基于苹果自研模型的新 AI 能力仍将被整合到操作系统中,将专注于主动为用户提供信息并在后台代表用户执行任务。
苹果公司内部将 iOS 18 视作史上最大的操作系统升级。根据此前媒体的爆料,Siri 将集成了更强大的大语言模型,变得更加智能。iMessage 能够根据上下文和意图,自动补全问题和句子,Apple Music 将根据用户习惯偏好,自动生成个性化的播放列表。Keynote 和 Pages 将加入 AI 辅助功能。Xcode 中也将整合 AI 能力,增加 AI 代码提示功能。
而根据 The Information 的报道,融入了 LLM 的 Siri,让用户能够自动执行复杂任务,这一功能将与快捷指令进行更深度的整合。
二、端侧 AI 或将崛起?
苹果一直侧重在本地终端设备上提供更好的 AI 体验,包括语音助理 Siri、面部识别 Face ID、照片分类 Photo Library 等功能。通过将 AI 处理集成到设备本身,苹果希望能够提供快速、安全的服务。
苹果此前宣布收购的 DarwinAI,其核心技术优势也是把 AI 系统做得更小型化,同时兼顾较高的处理速度,或许也是在为端侧 AI 做储备。
自去年初以来,苹果一直在测试其自研的大型语言模型,代号为 Ajax,因为使用 Google JAX 框架搭建。此外,苹果还开发了一个基于 Ajax 的聊天机器人服务,一些苹果工程师称之为“Apple GPT”。据内部人士称,苹果的技术仍不如谷歌和其他竞争对手的工具,这使得选择外部合作成为更好的选择。
苹果与谷歌的潜在合作可能会极大推动 Gemini 的普及率,苹果有近 15 亿 iPhone 活跃用户,可以在一夜之间影响生成式 AI 的格局。苹果和谷歌之间的谈判仍在进行中,在今年 6 月的 WWDC 之前,苹果都不太可能会公布相关消息。
三、除了Gemini,苹果还有哪些选择
过去的一个月,谷歌多次更新 Gemini,推出付费订阅版本的 Gemini Advanced (1.0 Ultra) ,发布Gemini 1.5 Pro 和开源模型 Gemma,以及发布了“世界模型”Genie 的论文。
这期间,谷歌也遭遇了一场舆论风波,用户发现 Gemini 的文生图功能“有意”避免生成白人图像,为了回避白人至上,反而让白人被 Gemini 在技术上给“歧视”了,随后有人挖出 Gemini 工程师关于种族方面的言论,进一步引发引发的舆论发酵。马斯克更是直接发推:觉醒思想病毒 (woke mind virus) 正在杀死西方文明。
谷歌很快暂停了图像生成功能,CEO 桑达尔·皮查伊称这个问题“完全不可接受”,在内部信中皮查伊还表示公司将进行“结构性改革”。
除了谷歌 ,苹果的生成式 AI 潜在合作伙伴还包括 OpenAI,以及 ChatGPT 最大竞争对手 Claude 背后的 Anthropic。但也有观点认为,苹果不太可能会选择与微软系的 OpenAI 进行合作,这会导致进一步扩大微软在 AI 领域的影响力,尤其是在大型语言模型方面。
而 Anthropic 的核心理念是让生成式人工智能更可理解、可信任和可对齐,提高生成式人工智能的安全性、可靠性和鲁棒性,同时也可以促进生成式人工智能的创新和发展。这与更强调隐私、安全,“以人为本”的苹果更接近,尤其是在推动技术发展和对社会负责的态度上,Anthropic 或许也是一个不错的选择。
由于众所周知的原因,在中国大陆,苹果大概率需要找一家中国大模型公司进行合作。类似三星的 S24,海外版接入了 Gemini,国内用了文心一言。又或者苹果可以直接推出大陆特供版,阉割掉部分功能,就像国行 iPhone 不支持 Apple Arcade、Apple News、 CallKit 等功能。
四、从 “Siri” 到 “Siri”,苹果的 AI 故事还要讲下去
当年苹果收购 Siri 时候,面对记者的询问,乔布斯强调 Siri 不是一家搜索公司,对进入搜索业务没有兴趣,而是因为 Siri 代表的人工智能技术。 在苹果内部,Siri 也一度被寄予厚望。但随着时间的推移,Siri 团队在苹果内部也经历了一些动荡,包括管理混乱、决策缓慢、代码笨重等问题。
这些问题导致了 Siri 在智能化上的进展缓慢,无法与 ChatGPT 等新兴 AI 技术相提并论。苹果公司对于 Siri 的发展方向和战略也存在分歧,一些前员工指出,苹果在隐私安全方面的立场以及对 Siri 功能的谨慎态度,限制了其进一步的发展和创新。
正如一位前苹果员工曾说:当史蒂夫在 Siri 发布的第二天去世的时候,Siri 团队就已经失去了愿景与蓝图,乔布斯的去世基本上标志着 Siri 原始团队计划的破灭。
具有划时代意义的 iPhone 4S 中的“S”不仅代表 Siri,也是“For Steve”。
从乔布斯强调 Siri 代表人工智能技术,到如今苹果正在使用大语言模型重新改造 Siri,并准备将其开发为杀手级 AI 应用,历史的确会押韵。设想一个乔布斯还在的平行世界,今天正上演 AI 故事也许会是另外一个版本。
无论如何,对于苦 Siri 久矣的 iPhone 用户来说,至少可以先期待一下 Siri 能否成功从“人工智障”进化为“人工智能”。
本文来自微信公众号: 硅星人Pro(ID:Si-Planet) ,作者:周一笑