微软的Kinect停产了,但它为今天的VR/AR做了很多贡献
雷锋网 (公众号:雷锋网) 按:Kinect 停产了。从 2010 年问世到 2017 年停产,当初曾被誉为颠覆游戏操控设备的 Kinect,如今再提起时,人们想到的并不是它为游戏带来了多好的体验,反而是它承载的传感技术对其他产品的贡献,就连 iPhone X 的前置摄像头也被外媒评为一台“Kinect”。
在外媒 Codesign 记者 Mark Wilson 的这篇文章中,他回顾了 Kinect 的发展历程,讲到了微软停产 Kinect 的原因。同时,Alex Kipman 也谈到了 Kinect 之后的研发,以及他自己之后的研究方向。雷锋网全文编译如下。
(图片来源:Microsoft)
微软 Kinect 负责人 Alex Kipman 和 Xbox 设备市场主管 Mattew Lapsen 在 Co.Design 的专访中放出消息:Kinect 已宣布停产。自 2010 年问世以来,这款为最初专为 Xbox 360 设计的,配有深度摄像头和语音识别麦克风的硬件,已经销售出约 3500 万台。但是微软现在宣布,出清现有库存后,将不再生产 Kinect。公司仍将为消费者提供 Xbox 和 Kinect 的维护服务,但后续的升级工具是否还将继续目前还未确定。
因为 Xbox 团队目前对抗 PS4 的战略已经从实验娱乐回到了传统游戏的方法,所以 Kinect 便渐渐退出了微软的未来发展重点领域。虽然 Kinect 不再以单独产品的形象出现在市场上,其核心的传感器技术仍将保留。 Kipman 仍然负责 Kinect v4(第四代版本) 和 Kinect v5(第五代版本)的研发,同时并入微软增强现实 HoloLens 项目。同时,Kinect 团队的专家们已经开始活跃在微软其他的关键技术项目中,比如 微软小娜语音助手、Windows Hello 生物面部 ID 系统,以及未来的情景感知 UI——GGV(Gaze、Gesture and Voice)项目。
(图片来源:Microsoft)
初识 Kinect
2010 年,微软花费了 5 亿美元的营销费用,推动 Kinect 上市。当时的推广片中,Kinect 将一个夜店的迪斯科球和无数红外线点投射到了一个 3D 空间中,同时可以对人体运动进行追踪,这在从前都是无法想象的。Kinect 似乎就是那个可以让游戏玩家从沙发上跳起来的完美设备。游戏中,当你可以直接用身体躲避时,何必还要按下键盘上的躲避按钮呢?Kinect 还支持语音指令,你可以直接说“打开 Xbox ”来开启设备。
我作为 2010 年就开始试用 Kinect 的用户,个人认为 Kinect 不仅仅只是微软推出的“任天堂 Wii 杀手”(所以大家是不是早就把任天堂 Wii 忘记了?!),它更是微软为了填补人体和设备界面之间,超越键盘、鼠标、触控屏极限的一次伟大尝试。我当时就写过这样的文字描述 Kinect:“不同于其他软硬件结合的设备,Kinect 给我带来的体验是非常特殊的。它是在适应用户,不是我在学习如何使用它,而是它在学习我的习惯。我从未体验过一个计算机能够如此地理解我,理解一个具有血肉之躯的人类。”
(图片来源:Microsoft)
可以毫不夸张地说,Kinect 是除了 iPhone 外,近年来最具影响力,或者至少是前所未有的硬件设备。根据微软所说,从技术角度来讲,Kinect 是第一款将机器学习作为其核心科技的消费级设备。从功能上讲,众多产品也从模仿 Kinect 中得到很多。
自 2010 年来,苹果仿效 Kinect 语音控制功能,推出了 Siri 语音助手;谷歌也开始了 3D 追踪系统 Project Tango(该项目的领导者是曾经研发 Kinect 的 Johnny Lee)。视觉和语音系统几乎成了智能手机的标配,也逐渐进入我们的家居领域。亚马逊 Echo 将语音助手带进爷爷奶奶的卧室。新一版的 Echo Show 还在 Alexa 上加装了摄像头。即使是联网的 Nest Cam 也得感谢开山鼻祖 Kinect 的贡献。同时,Kinect 也承担了这个新时代因为对个人隐私的担忧而引发的批评和攻击。
Kipman 在谈到 Kinect 引发业界对消费者隐私的普遍关注时说道:“信任这种东西,积累起来很难,却又能在一瞬间突然消失。Kinect 从 2010 年上市以来,逐渐积累起很多信任。但是周遭发生的任何坏事,只需一件,就能让这些信任顷刻崩塌。”但是, Xbox 失去消费者的原因,并不是信任或隐私问题,而是善变的粉丝们,他们认为创新减少了娱乐的乐趣。
(图片来源:Microsoft)
受到研发人员喜爱的 Kinect
“哦!我的天哪!真是见鬼!” 这是卡耐基梅隆大学创意工作室主管 Golan Levin 在听到 Kinect 停产消息时的反应。他的实验室,包括一些类似的实验室,在从实验艺术到创造出新一代 UI 界面的整个过程中,都在使用 Kinect,这已经成为了研究领域的一个重要工具。
Levin 接着说:“你知道,我们都依赖资本,大家也不期待微软会做一些会亏钱的事情。”他小心斟酌着措辞说,“但是 Kinect 停产真的令我感到伤心。一个有着众多应用,受众广泛,对创意实验、文化进步和二次创新来说,已经是一个基础平台的工具,居然决定不支持其核心业务了。”他总结道:“
大概一些人认为使用 Kinect 的游戏卖的不够多吧,这对微软的销售是一种侮辱。
"从在某种程度上讲,这的确是一个事实。
阻止 Kinect 取得市场胜利的一个重要因素也许就是“游戏玩家”了。虽然 Kinect 确实有一些功能缺陷(比如延时问题和语音指令识别错误),但作为 Xbox 360 的配件,仍然在市场上迅速赢得关注。但问题在于,Xbox 360 上一直没有优秀的游戏产品推出。没有像《使命召唤》或《侠盗猎车手》这样大制作的游戏开发商愿意为 Kinect 开发游戏内容。所以,微软似乎打算了一个巧妙计划。
为了让游戏开发商认为给 Kinect游戏下血本是值得的,微软给 Kinect 下了重注,将它和 Xbox 进行捆绑销售,保证其更大的市场空间。然而,微软在 Xbox One 中专门为 Kinect 保留的一些 RAM 和处理算力,却也让游戏开发商无法使用这部分资源来运行自己图形和程序。
Xbox One 在发行时的定位是“客厅电脑”——可以控制游戏、有线电视,甚至未来可以通过语音和手势控制整个家居。但在创新 UI 领域,索尼却策划出一场完美反击。在 Xbox One 发布后三周的 E3 游戏大会上,当时的索尼 CEO Jack Tretton 在台上发表了一次有些越界的演讲,他缓慢而有力地说,“索尼专注于玩家最渴望的东西……比如,PS4 不会强加任何新的限制在……”,他停了下来,因为人群开始大声欢呼——PS4 的所有系统资源会对开发者全部开放。Tretton 接着又抓住人们对 Xbox One 的另一个担忧,承诺索尼是一个秉承玩家优先的企业,并宣布 PS4 降价。
索尼这一举措在 Reddit 等论坛上好评如潮,尤其得到了自称“硬核玩家”用户的支持。一年后,PS4 的销量提升至 Xbox 的两倍。面对销售颓势,微软不得不对 Xbox One 降价,同时决定从芯片组中获得更多的游戏性能,所以只好解绑 Kinect,释放更多的系统资源。自此,Kinect 再也不是与 Xbox 捆绑销售的配件产品,也因此失去了对 Kinect 游戏开发者承诺的巨大市场。
(图片来源:Microsoft)
Lapsen 说:“Xbox One 发布时,我们本来的计划是让搭载有 Kinect 的游戏机提供最佳的体验,这是我们最初的目标。但是和其他产品一样,随着时间的推移,我们在不断学习和调整。实际中,Xbox 的目标演示越来越多地关注一些图形而不是人机交互的新形式,所以微软决定投资到其他产品。
但是 Levin 和其他一些相关研究者都非常喜爱 Kinect 的前沿技术。Levin 说:“Kinect 展示出的重要一点是,它可以使用便宜的深度摄像头,并支持千种使用深度感应的应用。”Levin 指出,正是微软的 Kinect的诞生,才让 Faceshift 这种创业公司能够存在。苹果为了用人脸识别代替指纹解锁,甚至收购了 Faceshift公司。为了利用该技术,苹果几乎是在 iPhone X 中克隆了一个 Kinect——苹果在 2013 年收购了以色列公司 PrimeSense,微软第一个 Kinect 中的 3D 追踪技术就是这家公司开发的。
“这只是 Kinect 可以实现的数千种应用中的一个。”Levin 接着说,“Kinect 对计算机、机器人和交互媒体艺术等各个领域的影响就更不用提了。”Levin 的一些学生使用 Kinect 制作出一部点阵 3D 的纪录片,并扩展该技术,在纽约地铁里上演了一部交互式电影。Levin 说,虽然目前市面上除了可破解的独立 Kinect 外,还有其他深度感应摄像机,但是,所有有基于 Kinect 的交互艺术展览的博物馆可能都想要在 eBay 上买一些 Kinect 库存吧。
(图片来源:Microsoft)
Kinect 的未来
Kinect 可能不再直接面对玩家和研发人员了,但它并没有完全消失。大企业的发展总是比任何单一产品的命运更加微妙。除了微软小娜这样的关键技术来源于 Kinect 外,Kinect 仍然会作为微软今后继续投资的一个关键传感器平台。
在与 Alex Kipman 的 skype 采访中,他在白板上写出了自己 10 年的发展过程——从 2007 年发展 Kinect,直到未来将要接手 HoloLens 产品。
Kipman 回忆道:
“我们一直在关注眼前的问题,我们正越来越多地使用技术。所以我们常说,‘如果我们这些技术上花费更多的时间,总能做出点什么来’。要么是我们不断用机器的方式与机器交互,学习屏幕后面的东西,要么就是教会机器如何与人类世界交互,模拟这个世界,教会它们如何与人类共存。而作为人类,我的选择是后者。“
那么计算机未来如何完全理解人类的存在呢?Kipman 的观点可以被分解成一个九宫格。X 轴表示输入、输出和触觉,Y 轴表示人类、环境和对象。从左上角向下扩散,每个格子所代表的难度是逐层提升的。所以追踪人类是困难的,但是追踪有着微妙变化的环境比追踪人还要难 10 倍,而追踪纹理复杂且情境不断变化中的对象,又比追踪人要难 100 倍。
Alex Kipman 草稿图
所以 Kipman 这个自认为很懒的工程师,首先关注于九宫格中最简单的格子——左上角那个 1X1 的问题,即人类的输入。计算机首先要理解人类的手势和语音。
“人们说我发明了 Kinect,”Kipman 讲道,“其实我并没有发明 Kinect,我只是在这个领域指出了这个最简单的机会。”
随着不断的研发,Kinect 的表现越来越好,它开始看到范围更广——从仅有的 50° 视场,提升到了 80°,如今 HoloLens 中使用的 Kinect V4 版本已经达到了 120°。同时更重要的是,它也更节能了:一天的功率峰值从 50W到 25W,直到现在的 1.5W。
稳步的提升也使得 Kinect 体积越来越小,我们已经可以将它穿戴起来。Kipman 说,我们已经解决了九宫格的左上角,正在往右下方努力。完成了最简单的问题,现在的我们应该更有野心。”所以在 2015年,微软就推出了 HoloLens,旨在解决那个难 10 倍的问题:环境和输出。这意味着 HoloLens 不仅需要看到人,还需要感知空间;不仅仅需要感知到空间,还能允许人类在这个空间中输出——拖拽全息图。
(图片来源:Microsoft)
Kipman 继续道:
“这就是 HoloLens 的关键任务——不仅理解人类的所有输入,同时从输出角度理解人类。目前,我可以将光子放在你的眼睛后方,让你看到全息图;我也可以让全息图浮在空间中。这两种方式完全不同,后者意味着我们也开始理解环境。”
下一步的计划是什么呢?HoloLens 的 R&D 部门将会继续让 Kinect 传感器变得更好。未发布的 Kinect V5 版本将会把功率降低到最活跃状态只需 1.5W(大约是原有能耗的五十分之一)。未来 AI 不断发展,硬件不断升级,微软可以开始解决那个 100 倍困难的问题——对象触觉问题。终极目标或许就是星际迷航中的全息甲板。我们再也不用操控光子,而是操控物质。就像在谷歌和 MIT 媒体实验室中测试的那样,数据和对象合二为一。
(Star Trek Holodeck 网络图片)
Kipman 说:“我们的愿景,我们的共同期待,也是我毕生的追求,就是不断努力将那个九宫格填满。让人类用更加人性的方式使用科技。”
via fastcodesign.com 雷锋网编译
。