AR 向左,AI 向右,智能眼镜来到十字路口
AR 是 AI 最好的载体,AI 是 AR 最好的交互。
从 Google Glass 到 Vision Pro,人类对智能眼镜的探索有进展,但都不算成功,直至 Ray-Ban Meta 的出现,这才让行业对智能眼镜重燃信心,从去年开始,随着 AI 大模型应用的深入,智能眼镜又有了新的故事可说。
今年下半年,百度和国内头部智能眼镜商 Rokid 发布搭载 AI 能力的智能眼镜,在百度和 Rokid 之外,小米和 苹果 也在被传将入局智能眼镜研发,与此同时,OPPO、vivo、华为、腾讯、字节跳动等 科技 大厂都在评估 AI 眼镜项目。
是继续在 AR 的路上走到黑,还是重新开辟一条 AI 路线,如今的智能眼镜走到了十字路口。
01 百镜大战
2012 年,被 Google 称为 " 登月计划 " 的 Google Glass 上线发布,在 Google 的计划中,Google Glass 的终极使命是 " 替代 手机 ",成为人们每天都能戴在眼睛上的 " 智能手机 "。
对标手机屏幕,Google Glass 采用棱镜投影技术,能够显示邮件、短信、导航等信息;
对标手机的影音娱乐功能,Google Glass 可以通过内置的 500 万像素摄像头完成第一人称拍摄,并通过棱镜投影回看影片;
对标手机的上网功能,Google Glass 支持语音搜索交互,用户可以问询一些天气、股票价格等知识类问题。
现实是残酷的,Google Glass 并没有完成预想中的大卖,至于 " 取代手机 " 更是边都没沾到。2015 年,Google 暂停了 Google Glass 的售卖。
行业对 Google Glass 的失败进行了归因分析,包括 营销 策略、落地场景缺失、市场接受度等问题。其中美国科技 媒体 Verge 明确指出,Google Glass 提供的许多功能(如语音拍照、导航)在智能手机上同样可用,但手机的体验更好、更便捷。
" 替换手机 " 这条路走不通,那就从眼镜的原始功能出发——提供差异化的视觉体验,于是智能眼镜厂商们死磕显示技术,AR/ VR 眼镜成为后 Google Glass 时代的主流。
为了实现更好的显示效果,AR/VR 眼镜的设计与普通眼镜有非常大的不同,通常采用极为夸张和科幻的造型,眼镜的重量成为行业始终没有解决的问题,加上贫瘠的应用和内容生态,AR/VR 眼镜在消费端至今没有掀起太大的波澜。
苹果召集 2000 多名设计师、工程师,历时 8 年,前后花费数十亿美元研发的 Vision Pro 就是其中的典型。
光就产品力而言,Vision Pro 确实已经做到了智能眼镜的极致,两块 Micro OLED 显示屏幕能够实现双眼接近 8K 的显示效果,像素密度达到惊人的 3400 PPI,远超我们在智能眼镜视距内的 PPI 分辨极限。
Vision Pro 发布之前,果粉们期待雀跃,可是产品发布后,市场用脚投票,发售不到一年即宣布停产,成为苹果 " 最短命 " 产品。
AR/VR 眼镜之后,行业迎来由 Ray-Ban Meta 所激活的 AI 眼镜热潮。
这款由 Meta 与雷朋公司合作打造的智能眼镜自去年 9 月上线,1 年多时间卖出了超过 100 万台,2024 年年度销量有望超过 200 万台,国金证券发布的研究报告预测,当 Ray-Ban Meta 的销售网络铺设到全球,其年销量潜力或可跃升至 600 万台以上。
Ray-Ban Meta 显然给了行业极大的示范与刺激,中国厂商中,百度今年推出的 " 小度 AI 眼镜 " 以及 Rokid 与时尚眼镜品牌 BOLON 合作的 "Rokid glasses" 颇受关注。
百度入局 AI 眼镜,源自号称 " 最懂中文 " 的文心大模型,可以无缝对接包括百度地图、搜索、百科在内的百度应用生态。
Rokid 此次推出的 "Rokid glasses" 接入了阿里巴巴通义千问大模型的算法能力,实现问题解答、实时翻译等功能。
除了百度、Rokid 外,还要很多科技公司也在布局智能眼镜产品。
今年 4 月份,AR 品牌 " 李未可 " 发布了 AI 智能眼镜 Meta Lens Chat;8 月份,小米生态链企业蜂巢科技推出了界环 AI 音频眼镜;同月,雷鸟创新与博士眼镜成立合资公司,首款产品预计年底发布 ……
根据公开信息及渠道消息,截至目前中国已经有至少 50 家公司正在推进智能眼镜项目。其中包括小米、华为、百度、字节跳动等领军企业,也包括雷鸟、影目、Rokid 等上一波智能眼镜浪潮中崛起的新兴厂商。海外厂商中,苹果、三星、谷歌等巨头也都在跃跃欲试,大有 " 百镜大战 " 的架势。
02 AI 带来的风口
仔细研究了 Ray-Ban Meta 的成功要素之后,所有的 AI 眼镜厂商都将拍照识别、音频录制播放和 AI 调用列为产品的三项主要功能,即智能眼镜既是相机,也是耳机,同时还是能帮你翻译、导航的 AI 助理。
AI 眼镜的定义似乎又回到了 Google Glass 时代,随着 AI 大模型的崛起,行业需要其他的类似手机一样的 AI 应用的物理载体。
回过头来复盘,Google Glass 的产品设计理念其实是没有问题的,只是提出这个想法的时间不对,就像 " 领先半步 " 理论说的那样," 领先一步是先驱,领先两步是先烈 "。
现在的技术成熟度与 Google Glass 发售的 12 年前有了天翻地覆的变化。
以最新发布的 Rokid Glasses 为例,与以往分体式设计有所不同,此次发布的 Rokid Glasses 采用了一体化结构布局,重量仅 49g。Rokid 产品团队将主板、电池等核心组件集成于纤薄框架之中,使得整体造型更加接近传统眼镜样式,极大地提升了佩戴者的舒适度及便携性,这是智能眼镜工业设计上的进步。
借助光波导技术的支持,该款 AR 眼镜能够在不影响正常视线的前提下,通过透明镜片展示出清晰细腻的虚拟界面,实现信息叠加显示效果,从而开辟了全新的人机交互模式,这是显示技术的进步。
功能性方面,Rokid Glasses 通过深度整合阿里巴巴旗下通义千问大模型的算法能力,能够轻松完成物体识别、文字翻译乃至数学题解答等多种任务。
比如快速准确地计算食物卡路里含量,并即时呈现给使用者;或者是在跨文化交流场景下,自动捕捉对话内容并实时转化为对方语言的文字提示,方便国际旅行者之间的沟通交流。这是 AI 大模型技术进步下的具体应用。
另外一个方面,供应链的成熟也大大降低了 AI 眼镜的进入门槛。
在行业人士看来,纯粹的 AI 眼镜属于轻量级的产品,硬件构成比较简单,AI 眼镜厂商只需要找一个白牌眼镜供应商,然后采购摄像头、声学模块、蓝牙模块、电池和处理器,再开发一个接入开源大模型手机 APP,一个具有基础功能的 AI 眼镜基本就成型了。
事实上,这样的产品很早就已经出现了,甚至比 Ray-Ban Meta 更早,拼多多上的 "AI 智能音频眼镜 " 价格普遍不超过 100 元,待机时长更是能够达到夸张的 240 小时,这也是行业能够形成 " 百镜大战 " 竞争格局的原因之一。
03 AR+AI= 未来
综合上文不难看出,智能眼镜发展至今已经形成了 3 条技术路线,即 " 具备 AR 功能的智能眼镜 "," 无显示屏的 AI 眼镜 " 和侧重于音频体验的 " 音频眼镜 "。
目前,AR 眼镜与 AI 眼镜除了显示能力之外,其主要差异在于交互方式上的不同,AI 眼镜是 VUI(语音交互界面),主要通过语音、TTS(文本转语音)以及指示灯反馈进行交互,AR 眼镜是 GUI(图像交互界面),主要通过显示、触控以及语音和 TTS 进行交互。
可是,无论哪类智能眼镜,现阶段都还没有摆脱续航、重量和算力的 " 不可能三角 ",与所有的智能终端一样,智能眼镜的功能越多,能耗也就越高,如果扩大电池的容量,又会影响到眼镜的重量。
在这方面,AR 眼镜的痛点尤其突出,一些产品笨重的头套式就劝退了很多想尝鲜的用户," 无显示屏的 AI 眼镜 " 虽然在一定程度上减轻了重量,但与普通眼镜 20-30 克的重量相比,还是较重。
目前市面上主流 AI 眼镜的重量在 45 克左右,可是如果配上镜片,根据镜片度数的不同,重量就还要往上再加 10 克以上,长时间佩戴还是会感觉不适。
除此之外,几乎所有的 AI 眼镜目前都没有解决续航问题。相比于手机、相机或者其他手持拍摄设备,Meta 持续拍摄最多可以维持 3 小时。这也是目前大部分 AI 眼镜产品的痛点。
这也是说,智能眼镜的产品还未完全定型,无论是 AR 眼镜还是 AI 眼镜,在行业真正爆发之前,还要大量的技术问题有待解决。
比如,AR 眼镜就有意识的融入 AI 技术,让自己的应用场景更加广泛,部分 AI 眼镜厂商则在努力加强自己的显示能力,同样是为了弥补自己的短板。
之所以会出现这样的情况,很大一个原因在于,行业普遍认为 AR 眼镜才是智能眼镜的最终形态," 人类有八成的信息通过视觉来接收,如果没有影像方面的交互,单凭 AI 能力是无法成为人类获取信息和服务的新入口的 ",有专业人士如是评述。
XREAL 创始人兼 CEO 徐驰在接受媒体采访时曾表示,"AR 是 AI 最好的载体,AI 是 AR 最好的交互,这很可能是未来十年最能够改变消费电子和我们终端体验的两个核心技术。"
智能眼镜的未来,AR 和 AI 或许会合二为一,但从当下来看,二者都还需要面对如何实现规模化,实现快速渗透的同一个挑战,要知道,行业唯一的爆款 Ray-Ban Meta 一年下来,也才卖出 100 多万台,这个数量是手机厂商们发布新品时 3 天就能达到的销量。
来源:洞见新研社