扎克伯格用业余时间开发的语音助手贾维斯,已经这么厉害了
据Fast Company报道,当新工程师加入Facebook时——无论是初出茅庐的毕业生还是从其他公司转投而来的副总级别的人物——他们都会在名为“Bootcamp”的新人训练营接受为期六个星期的密集培训。此计划旨在帮助他们了解公司庞大的代码库,以及一套不断发展的编程工具。
作为Facebook的创立者和首任工程师,马克· 扎克伯格 (Mark Zuckerberg)在早期给代码库贡献了比其他人都多的代码。
2004年 扎克伯格 在哈佛宿舍里创办了Facebook,两年后推出Bootcamp计划,然而这位现年32岁的CEO从来没参加过Bootcamp。
今年一月,扎克伯格宣布了他2016年的年度目标:他要打造一个人工智能系统,使用Facebook软件工具来管理他的家。AI是对Facebook未来至关重要的技术领域,新的开发目标也迫使他更新自己对编程和工作流程的经验。同时这又将他与工程师的日常经验和企业文化重新联系在一起。
然而Facebook CEO的职位并不允许他拿出六个星期的时间参加“新人再教育”。
“我没有经历正式的Bootcamp培训。”上周扎克伯格在位于帕洛奥图的家中接受记者采访。他要给记者展示一个现实版贾维斯的Demo,这是该项目首次接受采访。“但是当我问人们问题时,你可以想象他们回复得很快。”
(扎克伯格指挥他的贾维斯AI助理开灯)
扎克伯格一直以来喜欢开发所带来的“确定性”,这是打造任何梦想之物所需的基本元素。与此相比,作为企业领导人,指挥着一万五千人的团队服务数十亿用户虽然堪称野心勃勃,但他错过了愉快的确定性。
也正是这个原因让他在闲暇时间继续从事小型项目的开发。他在2012年给自己立下的年度挑战是每天写代码。多年来他一直参加多个公司的黑客马拉松,并且作为闲暇练手,他曾经写了一个系统,通过配对Facebook组织图和内部社交图查看公司里哪个团体最具社交关系。
扎克伯格告诉记者,亲自力行参与编码让他重拾初学汉语时的感觉——2010年他将学汉语作为年度目标——大脑感觉到被激活的兴奋。
Facebook的企业文化要求如果你开发的程序出现毛病,你就得停止手头正在做的事去解决问题。这个要求对于日理万机的大公司CEO来说当然不太实际。“我要么被迫退出会议,要么就得请其他人修改我的代码,后者当然要不得。”他说。以至于很多时候他都是在工作时间修改他私人项目的代码。
在过去一年,扎克伯格在他的家庭项目上总共投入了大概100~150个小时。
虽然它被效仿钢铁侠命名为“贾维斯”,但它更像是Alexa那样的高度个人化的东西:他和妻子普莉希拉使用定制的iPhone程序或Facebook Messenger聊天机器人控制电灯开关、根据个人口味播放音乐、为访客开门、烤吐司片、还有提醒他们一岁的女儿Max不要忘了上汉语课。
扎克伯格的房子坐落在帕洛奥图17000平方英尺的安静地段。当你造访时,贾维斯识别来客,并提醒主人你的到达。当你穿过木门,穿过花园走廊,扎克伯格会亲自出来迎接你。
不管线上线下,扎克伯格的外表看起来都是同一副打扮:短棕色的头发配上灰色T恤和牛仔裤。你在网络照片和视频中见到太多次这个形象,以至于可能会需要一点时间来确定此时在门口欢迎你的是真人本人。
最近几个星期扎克伯格工作上的事儿比较忙,他在同时努力解决三个难题:关于Facebook在总统大选前是否是假新闻的主要传播驱动力,与股东交涉在卖出股票的情况下保留对企业的控制权,同时广告客户也在关注Facebook在广告点击观看率上的计算方法。
相比之下谈论贾维斯是比较轻松的任务。扎克伯格坐在客厅里的一个深绿色沙发上,他的匈牙利牧羊犬卧在一边。扎克伯格轻松自在地向记者讲述过去一年里打造贾维斯系统的经历,它如何让事情变得更简单,当然偶尔也会带来麻烦。
在他一月份对外宣布贾维斯项目的文章中,扎克伯格写道:他将开始建立一个系统,允许他使用声音控制房子里的一切,包括音乐、灯光和温度。他还想让贾维斯通过人像识别实现访客接待,并且在客人到达时嘱咐对方在小女儿房间里的注意事项。他希望该系统能“用VR可视化数据帮助我打造更好的服务,更有效率地领导我的组织”。
一年之后的今天,他已经实现了诺言中的绝大部分——VR部分有所保留——而且它整体上运转良好。在他对记者展示这个系统时,还是出现了一些小瑕疵。
Messenger聊天机器人被作为整个系统的前端。扎克伯格首先打开Messenger,演示开关灯。效果令人满意。
同时他还建立了响应语音指令的系统。他为此单独开发了一个iOS应用程序。展示结果并不太理想,他不得不反复讲了四次才让系统弄明白他的指令。
“喔,这应该是它最失败的表现了。”扎克伯格略显尴尬地说。
让系统播放音乐很成功。“给我们放段音乐吧。”他下达命令。几秒钟后,David Guetta的 “Would I Lie to You” 开始响起来。“把音量调高。”他说了两次,系统都做到了。最后他同样用了两次才让智能管家把音乐停了下来。
贾维斯最让扎克伯格骄傲的地方在于它能习得主人夫妻俩不同的音乐口味。当妻子要放音乐时,它就会推荐妻子喜欢的而不是男主人的喜好。它还被设计能按音乐风格播放曲子,比如“轻松的”、“适合家庭氛围的”或者“与这位歌手风格相似的歌”。
“来段红辣椒乐队那种的。”扎克伯格说。几秒钟后,客厅里响起了Nirvana的 “Smells Like Teen Spirit”。
扎克伯格也希望贾维斯能够在一定程度上理解语言差异。然而理解非常相似的短语对贾维斯比较有难度。比如“Play‘Someone Like You’”和“Play someone like Adele”以及“Play some Adele”虽然表面上相似,但实际含义则大不同。扎克伯格希望系统通过反馈来习得不同用语之间的差别,并称过程相当有趣。
偶尔惹得老婆发怒
除了选择正确的音乐进行播放外,还需要确保贾维斯不会惹恼普莉希拉。即使要求系统开灯、关灯、播放音乐等,可能也会产生许多令人感到惊讶的歧义,让贾维斯感到不知所措。
举例来说,扎克伯格与妻子有时候会使用不同的短语形容相同的东西,扎克伯格称为客厅的房间被普莉希拉称为家庭活动室,因此贾维斯需要学会理解同义词。但扎克伯格不希望贾维斯仅仅记住不同的短语,他还教贾维斯学习理解它们,以及它们在不同情境中的不同含义,显然这都是非常有趣的问题。
(图:贾维斯可以让扎克伯格使用Messenger聊天机器人,来欢迎朋友到访。)
扎克伯格说:“你会碰到这样的情况:我只会说‘打开房间的灯’,可是房间中的灯光有些刺眼,因此普莉希拉会说‘调暗灯光’。但她不会说调暗哪个房间的灯光,因此贾维斯需要知道我们的位置,否则它就可能执行错误命令。有时候,我会说‘播放音乐’,贾维斯会打开Max所在房间的音乐,因为我们此前就是那样给它下令的。”如果Max碰巧在午睡会如何?扎克伯格说:“这是个巨大的失败,这是惹怒你老婆的绝佳方式!”
确认位置非常重要的另一个例证:作为创造最佳收视体验方案的组成部分,贾维斯会关掉灯。扎克伯格说:“其中与电视所在房间相邻的另一个房间就是普莉希拉的办公室,为此这就出现一个有趣的问题:当我要去看电视时,贾维斯会关掉楼下所有的灯。而这时普莉希拉正要去工作,这会让她觉得疯狂!”
比预期要容易得多
尽管扎克伯格只会选择一个年度个人挑战,但在2016年时,他选择了两个,第二个就是全年跑步587公里。这意味着,他在继续开发贾维斯的过程中,不能坐得太久。就像他为自己设定的2015年挑战,每两周读一本书。事实上,扎克伯格用于开发贾维斯的时间比跑步时间更少,在很大程度上,这要感谢Facebook的收集工具,他可以经常利用图片和语音识别功能对贾维斯进行测试。
但扎克伯格没有想到的是,这个项目最难的地方在于如何将贾维斯与家中各种不同的系统相连,包括控制灯、门以及温度的Crestron智能家居系统、安全系统、Sonos流媒体盒以及Spotify音乐等,他想要通过贾维斯控制这些系统。
严格来说,扎克伯格的家庭网络是Facebook企业基础设施的重要组成部分,拥有严格的保护措施。任何东西要想与这套网络相连,必须获得Facebook的安全证书。从本质上说,这种证书就是数字认证密匙,以确保指定的设备安全。
而这种安全措施却大大限制了扎克伯格的控制能力。以联网冰箱为例,它没有Facebook的安全证书。对于大多数人来说,这都不是问题。但是这里的大多数人不包括扎克伯格,确保他在家时的安全非常重要。扎克伯格已经找到通过互联网连接交换机安全控制某些电器的方式,这至少可让他能够遥控开关电源。扎克伯格希望贾维斯能够利用他此前留在面包机中面包片制作早餐吐司,但现在还没有任何面包机电源关闭的情况下烤面包。为此,扎克伯格购买了20世纪50年代的低技术产品,以方便他对其进行控制。
最终,要想实现所有家居物品都能够相连,这需要许多时间对它们采用的产品和服务软件进行逆向工程操作。在开始开发AI之前,扎克伯格就需要做完这些事情。
(图:扎克伯格收到Messenger通知,贾维斯已经打开大门,尽管后者同时也在控制他的Sonos音乐系统。)
还未准备好面世
尽管贾维斯在记者面前的表现不够完美,但这款伯格依然为其目前取得的成就感到骄傲。他表示愿意将贾维斯与当前你能在市场上买到的同类产品进行对比,比如亚马逊Echo(Alexa支持)和Google Home(Google Assistant支持)。
扎克伯格强调:“贾维斯还未准备好上市供更多人使用。但如果我无法开发出至少可媲美Echo或Google Home的东西,我可能对自己感到相当失望。”
扎克伯格补充说,与为单栋住宅设计AI系统相比,开发类似亚马逊和谷歌的智能系统,让数以百万计的人们控制多款设备更难。
为此,他没有将贾维斯当成Facebook产品推出的计划。但扎克伯格表示:“如果我无法围绕音乐推荐或以不同方式使用面部识别、理解屋内情境环境等对AI进行改进,那么我不认为自己真的推动AI大步向前。”
扎克伯格称,事实上他打算发布自己所从事工作的摘要,如果他的某些结论最终能被整合到可用的公开系统中,他会感到非常高兴。这也反映出Facebook开源其大部分工作的哲学,特别是在AI方面。这样的教训包括我们利用文本和语音进行互动。与贾维斯的对话让播放语音的指令变得有意义。但扎克伯格发现,在很多情况下,文本依然很重要,特别是在有其他人在场的情况下。他说:“如果我允许某人进门,这与我周围的人无关,为此我宁可发短信。”
即使扎克伯格经常发布语音指令,但他更喜欢贾维斯以文本方式回应他或显示某些信息,而无需大声说出来。扎克伯格说:“当贾维斯讲话时,意味着其会发布许多指令,而这是相当恼人的事情。”但这并非是说语音指令不重要,在特定时候,还是需要语音指令。
扎克伯格从未幻想过自己只用150小时就能赶上Facebook的AI专家每年投入数千小时以上开发出的AI,而Facebook有许多业内最顶级的AI人才。
不过,在好奇心驱使下,扎克伯格已经让贾维斯达到非常先进的水平,他已经准备好向世界展示它。扎克伯格说,他每天都在摆弄贾维斯,因为他每天都会使用它,总是要修正小问题或添加新功能。但他很高兴自己和家人可以对贾维斯进行随意调整。
扎克伯格说:“这种感觉超棒,早上醒来时,你只要对贾维斯说‘早上好’或‘醒来’,整栋房子似乎也随之醒来。与之类似,当你晚上准备上床睡觉时,无需关掉每个房间的灯,只需要说‘晚安’,贾维斯就会帮你关灯,并确保锁好门。”
当然,扎克伯格不仅是需要更好照顾家人的丈夫和父亲,他还是大科技公司的领导者。这家公司的命运已经注定,需要通过有效的方式促使技术人才创造更伟大的产品。对于扎克伯格来说,参与贾维斯项目最好的地方就是,他重新获得Facebook的工程体验。
他说:“因为我花了很多时间利用Facebook的工具编码,作为公司首席执行官,我通常不会那样做。我觉得自己好像成为Facebook的新工程师,正帮助Facebook加速扩张。我非常喜欢这些内部工具,它们已经成为企业文化的重要组成部分。”
查看原文