关于智能眼镜,你不知道的那些冷知识(二):核心篇
本文作者:本文作者艾韬,易瞳科技 CTO,毕业于多伦多大学计算机工程专业,多年跟随 “世界穿戴电脑之父” Steve Mann 教授,专注于智能眼镜的基础研究,尔后归国创业获得导师 Steve Mann 和其实验室全力支持。公司邮箱:info@visionertech.com。本文首发于易瞳科技微信公众号,授权 36 氪转载。查看本系列文章 点这里 。
刚才把这篇文章发给陈东义老师(中国最早研究穿戴电脑的顶尖学者,上海乐相科技创始人陈朝阳的导师)。他觉得文章中 Humanistic Intelligence 的中文释义可作人文智能(或人本智能)。陈老师还跟我说 “很有必要普及 Mann 的概念,目前 Wearable 这个领域没有超越 Mann 理念的。现在的很多观点,都没有超越,还落后。Mann 的理念是可穿戴的核心,是未来的方向。”
前不久,一篇 AI 下围棋的新闻炒得沸沸扬扬,围棋 AI 在人类历史上第一次战胜职业选手。然而,就像当年被 “深蓝” 打败的国际象棋大师 Garry 所说的那样,这并不意味着电脑在象棋领域取代了人类。不仅仅是下棋,AI 再聪明,它也取代不了人。我相信,最终取代人脑的不是电脑,而是 “人脑 + 电脑” 。未来的象棋或围棋大师,不是人也不是电脑,而是最会用电脑分析棋局的人。一个相信计算机,并且能和计算机兼容的人,叫 Cyborg(赛博格)。这个人机共生体,实现的不是 AI,而是 HI。
上一次在概念篇中跟大家探讨了智能眼镜中的一些概念,基本上覆盖了所有智能眼镜的形态,也就是大家正在做的是什么。但我觉得,比 “做什么(What)” 和 “怎么做(How)” 更重要的是 “为什么(Why)”。这是一个框架,也代表了一个愿景。更重要的,这是一个核心。
所以,今天要给大家介绍的东西叫 Humanistic Intelligence (HI),由穿戴电脑之父 Steve Mann 教授于上世纪 90年 代提出。在电子科大 陈东义 老师(国内最早研究穿戴电脑的学者)的笔下,HI 的中文翻译是 “ 人文智能 ”。HI 凝聚了上世纪顶尖学者的心血,在过去的 30 多年里,智能眼镜的发展方向是以 HI 为指导思想的。而实现 HI 中的 “人机共生”,就是我们做智能眼镜的初心。
前年底当我快要离开实验室的时候,实验室的名称已经从之前的 “EyeTap Personal Imaging Lab(ePI Lab)” 改成 “HI Lab” 了。去年底,回实验室拜访教授时,他让我在实验室的宣传视频中向多伦多大学的新生们介绍一下我对 HI 的理解。所以,在我向你们扔出密密麻麻的文字之前,可以先看一看下面这段小视频( 视频地址 )。在介绍从实验室走出来的各个黑科技创业公司的同时,我也把我心目中所理解的 HI 给大家简单地说了一下。视频中的翻译字幕,我放在文末尾,不想看视频的去看字吧。
好啦,言归正传。传统意义上的 “人机交互(HCI)” 把人和计算机分开成两个孤立的个体,它们通过各种 I/O 进行通讯,从而传达信息。鼠标,键盘,耳机和触屏都是我们熟悉的交互方式。然而,由 HI 所提出的 “人机共生” 把计算机和人当作一个整体。在这个体系中,计算机是人的第二个大脑,辅助佩戴者工作的同时,在使用者的指导下学习并改变着这个世界。所以,就像视频中提到的那样, 你觉得自己在玩儿计算机,其实计算机也在玩儿你。
接下来,我会跟大家简单讨论一篇论文的内容。这是 98年IEEE 期刊的封面文章,比较系统地阐述了 HI 的各个方面,同时也对 HI 如何指导智能眼镜的研发有一个很明确的叙述。由于我水平有限,需要注意的是,以下内容是一个小工程师对一个大师思想的反刍倒嚼。是我进食后经过一段时间从肚子里吐出来的半消化物。大家品尝的时候要注意,大神们请从文末链接直接下原文。
HI 描述的是零距离的人机关系,所以 HI 的实现就需要人与机的紧密结合,而所有人机交互中,智能眼镜可以把需要传达的信息量实现到最大化。从大方向说,实现 HI 所需的系统有三种运行模式:
第一,Constancy(恒定模式)。这个系统必须恒定持续地运行(Operationally Constant,OC),它偶尔会进入睡眠状态,但它不应该完全断电。现在大家用手机时就可以深切感受到 OC 的重要性。没电的手机就失去了 OC,令人崩溃。另外,这个系统必须恒定持续地可交互(Interactionally Constant,IC)。也就是说,它随时处于待命状态。从这个意义上来说,IC 就意味着 OC,但 OC 不一定代表 IC。读到这里,Apple 为什么要多出一个 iWatch 的原因就很清楚了。手机在兜里,虽然持续运行,但不可持续交互,所以没有实现 IC;为了缩短 “交互距离”,手机就需要多一块表。通常人们不一定能意识到恒定模式的重要性,所以大多数电子设备的 “交互距离” 是很大的。作为 HI 的最基本的运行模式,恒定模式是实现智能眼镜的第一步。有恒定模式的人机交互如下图所示,人与机互相通讯,共同作业。
第二,Augmentation(增强模式)。传统的人机交互的观点通常把计算(Computation)本身作为最主要的任务。然而,HI 的观点是把计算融入更重要的人的任务中去。实现增强模式的应用有一个特点,就是人在用计算机的同时,还在做一件别的事情。而通常来说,这件对于计算机来说的 “别的事情” 才是这个人机共同体的主要任务。例如某人在用导航的时候,首先他要开车要看路,他不能总是盯着屏,所以路径图要在视线范围内的一个方便的位置并加上语音辅助;其次计算机给出的所谓最短路径并不是唯一方案。某人(我不会开车,所以不是我)要去接个女性朋友,他就不会考虑最初给予的最短路径而希望系统持续更新并重新规划路径,实现了增强模式的系统示意。如下图,人可以同时接受来自物理世界(真实环境)和数字世界(虚拟图像)的信息,并同时和两个世界进行交互。
第三,Mediation(介导模式)。当上述两个模式可以被某种系统实现之后,这个系统可以通过介导模式将人机更紧密的结合起来。这个时候,计算机的输入和输出就和人的感知和运动无缝地连接在一起了。实际上,我们说介导模式就是计算机对人的一种封装。拿智能眼镜举例子,有增强模式的智能眼镜可以让佩戴者同时看到自然光和数字光,而有介导模式的智能眼镜先通过传感器采集自然光,并对这些数字化过后的光做出需要的调整,最后把这些数字化的光通过设备重新还原出来。这样佩戴者会感觉到他看到的世界以一种新的方式呈现出来。然而,现实是没有变的,被改变的只是佩戴者的感官。如下图,这种封装既能使人从现实中脱离出去,又能使人以更强的感官去感受现实。从这个意义上来说,介导模式增强了人的能力。
综上所述,HI 的三个模式是可以并存于一个系统之内的。对于人来说,听觉和视觉信号是可以数字化的信号。而视觉信息所能传递的信息量比听觉要大很多。因此,计算机的交互发展会以视觉为主导。在智能眼镜当中的概念(VR,AR,和 MR),即虚拟现实,增强现实和介导现实的实现也必须以上述三个模式来运行。如下图,结合三个模式并可以相互转换的话,我们就有了一个完整的 HI 示意图。
当然,既然是科普,有些东西不会讲的特别细。系统运行当中的六个基本信号流程及其作用本质我这里就不多做说明了。能读到这里感觉味道还不错的同学我建议你们去下载教授的原文,原文中会对下图所示的完整 HI 进行详细的阐述。
最后,附上原文链接和视频字幕:
http://www.eyetap.org/papers/docs/HumanisticComputing_Mann1998_ProcIEEE.pdf
HI 代表的是 Humanistic Intelligence,
它是我们实验室里进行各种工作的指导思想。
大家经常问我对人工智能的看法,
人工智能确实酷,但同时,它是冰冷的。
对我来说:HI 是有心灵的人工智能,
它是为了改良一个物种,
而非创造一个新的物种。
在 HI 反馈环里,
人和计算机实质上是一个整体。
我们在研究穿戴电脑的时候,
遵循的是人机共生的思想。
你觉得自己在玩计算机,
其实计算机也在玩你。
过去我们一直想培养具有 STEM 素养的人才,
也就是科学,技术,工程和数学,
但这种理念漏掉了对心灵的培养。
教授 Steve 提出 DAST,
认为全面教育应该包括:
设计,艺术,科学和技术。
所以我们相信:在 HI 实验里,
优秀的学生不仅仅要写出没有 BUG 的软件,
或做出高速运算的硬件。
我们希望你尝试
去找到真心喜欢和特别擅长的契合点。
我觉得对你来说,
这个点才能让你成为一个走心的工程师。
本文来自读者投稿,不代表 36氪 立场,如若转载,请注明出处:http://36kr.com/p/5043813.html
“看完这篇还不够?如果你也在创业,并且希望自己的项目被报道,请 戳这里 告诉我们!”