没有任何行业可以忽视人工智能——《麻省理工科技评论》 EmTech Digital 峰会干货整理
我们都应该去熟悉人工智能这一新鲜事物。
黑马说
在这个时代,科技是最大的生产力。不管你是哪个行业、什么职业,关注最新的科技都不会有错。人工智能的时代大潮不可逆转,没有人能够忽视它的存在,尤其是对于投资者和创业者来说。
文|DeepTech深科技 翻译|杨一鸟,机器之心,羊羽,十三
60年前的夏天,4名电脑科学教授一起启动了一个目标为创造"人工智能”的夏季课题。这是这个名词第一次出现在世界上。此课题的目标是:探索如何让机器运用语言和抽象思维。
当时的项目提议是:“我们认为,一组精挑细选的科学家在一起工作一整个夏天就可以实现重大突破。”这在现在看来简直是乐观的傲慢。我们直到现在都没有可以媲美人类语言或者可以实现抽象思维的软件。
但是,最近的几年里,人工智能软件已经实现了曾经被认为是不可能的功能。例如识别图像和语音,或者像谷歌最近给他们的电子邮件服务添加的功能:通过人工智能对语言的理解来写出短邮件回复。
——《麻省理工科技评论》主编 Jason Pontin
5月23日在旧金山举办的为期2天的《麻省理工科技评论》Emtech Digital 峰会上,来自各行业的精英们探讨了这项科技是如何开启人类生活及工作的新可能。 下面是《麻省理工科技评论》EmTech Digital峰会部分精华内容整理:
GE软件研发副总裁Colin Parris:将人工智能引入工业互联网
GE的“数字双胞胎模型”(Digital Twin)灵感来源于长期应用于工业生产的产品和设备,拿航空制造业来说,引擎发动机在此行业中生产了将近40年。工业中的设备和产品技术投入巨大, 效率的提高是工业生产发展的核心课题 ,而 模型的提出是为了解决如何使得我们更加高效地使用和制造这些东西 。
2005到2010年,工业增长率达到4%,而2010到2015却只有1%,这是生产力的退步么?GE Software就此提出构想,我们能否从生产设备出发,合理规划生产环节,将生产效率提高。
“数字双胞胎模型”的设计理念源自于商业应中用的 “数字信息转化模型” (Digital Transformation),其中最出名的就是这三家公司的产品:苹果,亚马逊以及谷歌。它们有两个共同点,一个是它们对于数字信息转化的方案大同小异,而且公司市值的增速也都相当惊人,苹果公司在2004年的市值才80亿,而现在已经高达2340亿。
让我们说回数字模型,拿亚马逊来说,他们首先建立“单位模型(Model of One)”来统计用户的全面信息。这些 信息来源于每一个用户,并且有一系列数据标签 ,包括年龄、性别和收入。用户信息在你逛亚马逊网站的时候就已经悄无声息地收集了,例如你查看的商品、付款方式、送货地址以及你购物车里的东西。而初代模型其实就反应了我们的购物心理,即喜欢买什么以及怎样购买。亚马逊然后将初代模型进行数据分类以及数据分析,得到能应用于商业的输出信息。
而将用户的购买兴趣和购买力进行分类在这里是十分关键的 ,例如我如果被分在“型男区”,而此区的用户大部分都买了“男人装”,那网站就会向我推荐。除此之外,亚马逊还将各个用户的信息编纂起来,并向他们定向推荐商品和个性化服务,例如我已经在亚马逊上订购了年末的滑雪双飞旅程,网站会以此为基础向我推荐一些滑雪的装备例如滑雪头盔之类的。我购买完商品之后又会向网站提供反馈,点赞或者差评之类。我买得越多,他们提供的信息就越来越完备,这是一个正反馈的流程。
这样的机制就是“ 单位信息处理(P&L of One) ”。用不了多久,依靠此模型,亚马逊就会知道我会花多少钱购物,以及怎样让我多花钱。从初代模型到用户信息模型,商业价值就产生了。除此之外,一个收集信息的平台也将推出,用来更方便地收集信息,例如亚马逊的购物网站、苹果的iTunes以及谷歌的搜索引擎。
那么“数字双胞胎模型”的机制也十分类似,只是将上述商业模型直接搬到了工业上来, 持续对生产设备的各个部件进行监控和分析 ,并期望得到特定的商业价值。我们同样需要收集数据,例如收集引擎的生产数据、维修数据以及运转数据,然后构建“单位模型”以及“单位信息处理”,而相应的输出数据则从购物推荐、个性化服务以及评价系统变成“效率评估”、“性能评估”以及“产品商业评估”。
具体来说,就是将具有物理实体的机器所有信息收集起来,数据化,建立一个数字模型,就像它们的“双胞胎”一样,然后 运用这个模型来预测机器会遭遇的问题或者来调试机器参数 ,使得它的效率更高。举个例子,GE90飞机引擎的问题预测,如图所示是经常途径炎热地区的飞机的引擎,其中的扇片上有防热涂层(TB Coating)。这样的涂层一旦损坏,就会影响发动机的性能,严重的话会造成人员伤亡。航空公司对此也是十分慎重,也发现了一些规律,往往200天这样的引擎就会出现问题,所以200天期限一到,就要进行引擎的检修。
这样的经验可能会灵验几次,但往往误差很大,如果200天中有很多天气温并不是很高则会减缓涂层损坏的速度,或者是湿度过大加速涂层的损坏。这样简单粗暴地将引擎送往检修,往往可能检测不出损坏,而此期间飞机也不能使用,白白增加了维修成本也降低了商业价值的产生。如果针对此涂层建立“数字双胞胎模型”,在每次飞行之后根据此次飞行的气温湿度等相关数据进行模拟分析,到了模型中损坏快出现的时候提前检修,这就使得维修显得十分及时了。
其实“数字双胞胎模型”能提供的服务还有很多,例如上述的“维修服务优化”、“工作方案优化”、“生产优化”、“服务优化”、“辅助设计优化”以及“新服务方案设计”。只要你提供数据,我们就能提供巨大的商业价值回报。
“数字双胞胎模型”中还应用了很多机器学习的理念,在这里我介绍其中的三个。
第一个 是我们如何正确取得我们想要的数据,其中引入了计算机视觉采集技术;
第二项 技术是我们怎样将数据进行过滤,并找到正确的我们想要的数据;
最后 是如何建立我们的“数字双胞胎模型”。
问答环节:
主持人:我们都知道,双胞胎的基因十分相似,但是他们之间还是有这样那样的差别,那么你们所谓的“数字双胞胎模型”和它们现实中对应的物体之间也是有差别的吧。我的问题是,这种差别有多大,并且你们怎样应对这样的差别?
科伦帕里斯:我们的应对呢,总的来说有两种,而差别一般分为三类。那么我们对不同的差别有不同的应对方案。 第一种差别是有人对产品做了改变然而并没有告诉我们 ,这其实是我们最常遭遇的,那么我们则需要反复对比实际以及校对参数来保证模型的拟真程度。
第二种是新变量的产生,比如我们观测到的一个很诡异的现象 ——地球的“高空急流”实际上会变化——而当这样的变化产生时,地球上炎热地区的气候也会发生改变。而一旦我们观测到这样的新变量,数字双胞胎模型也要自然地做出相应的改良。
有些情况下,我们得到的数据并不完整, 当你的数据缺失大到某种程度的时候,你的模型与现实的差异就比较明显了 。这种情况下,我们一般采取的措施是,首先核对实际数据,或者采用其他相关数据分析,比如大气层的变化或其他我们观测到的与气候变化相关的数据,然后开始全面地学习和分析差异性的成因和影响。 因为我们看待的是一整个综合的问题,其中的各个组成部分中也会存在差异产生的因素,当我们把这些因素都整合到一起,问题就基本解决了。
主持人:那“高空急流”的改变发生过几次呢?
科伦帕里斯:我们就观测到过一次,你也知道研究“全球变暖问题”是一个无法预测的事情。
Founders Fund联合创始人Luke Nosek:医生将被人工智能取代
Founders Fund是一家投资公司,专门投资高新科技公司,这些公司一定是能对人类文明做出巨大贡献的,如Airbnb、Stripe、LinkedIn、SpaceX、Yelp等高科技创新公司。Luke Nosek也是DeepMind的董事会成员,此前在韩国取得重大成功的AlphaGo就是他们的杰作。
主持人:像电影里那样,人们对人工智能都有或多或少的恐慌。你们认为人工智能对于人类工作机会的影响有哪些?
Luke:我觉得, 人工智能既在创造人类的工作机会也在减少人类的工作机会 。那我就举一个常见的例子:优步(Uber)。优步的出现就创造了全民司机的世界,虽然这不是传统意义的人工智能,其实也是基于计算机技术的软件应用。而如果真正的人工智能驾驶系统建立完备,司机这种职业将不复存在。这就是我说的,工作种类的变革变得越来越快, 一些工种消失,一些对应的工种就要出现 。这也需要当下经济状况良好,有着这样那样的公司出现来承载这样的新职业,如此新的工种才能创造经济价值。
主持人:那么对于那些特殊工种而言呢?比如医生,他们接受了长期的培训,就为了与人治病救死扶伤,现在如果机器能比他们更加准确,那么他们也将被替换,你是这样认为的么?
Luke:恩,这是一个很难回答的问题。这些人一生都在接受培训,做一些特殊的事情。我并不这样认为。我觉得人工智能能在临床医学做的就只有处理数据的部分,因为医生往往不能记住繁多的病人病历还有最近最新发表的医学论文,而机器却十分擅长。但是机器也有做不来的地方,它们不能陪伴病人,使他们得到安慰,也不能照顾病人,而这些都是人类能做的。也就是说,我觉得 机器和人类都能在其中找到自己最擅长的工作部分 。
主持人:我不敢对整个医学界妄加评论,但是你貌似觉得在医护人员中只有一部分能继续留下来,不被机器抢了饭碗,例如护士、康复师以及物理治疗师。是这样么?
Luke:我觉得最终会是这样的。不过也许需要数十年吧。
主持人:不过最近的研究表明,人工智能的出 现不会产生新的雇佣关系,也不太会改变现有的雇佣关系结构 ,而只是会在此基础上加入一点新元素: 工作之中越来越频繁的人机交流 。这样的场景相信大家都在电影中看见过,那么你是怎么看待这样的景象的呢?能为我们描述一下你心中的那个场景么?
Luke:我还是以临床医学为例子,这样的情况下,医生就有更多的时间花在病人身上了。教育中的情况也十分类似,人工智能将一些负责一些重复性的工作,例如评分系统,以及设计课程。而老师的角色就在于分析每一个学生的信息,然后加入情感方面的判断,建立学生和人工智能之间的联系,让人工智能给学生的帮助更加恰当。
主持人:我这几天都在看到这样那样的新闻和呼声,人们呼吁对人工智能的发展和研究设定一个标准。我个人觉得,规定人工智能的发展标准是十分困难的,因为有些事情并不能预测。那么你作为投资者,觉得人工智能的发展需不需要受到限制呢?
Luke:我觉得是十分困难的。而且就算要设立标准这个范围也是很广的,你也无从下手。最关键的是这种 新型科技的发展本来就是未知的 ,标准就更加难以定义了,就好比我们古代的医学,也是显得十分粗鄙,但是还是一步一步发展过来,但是那时候也没有任何人规定手术时不能用某种剪刀吧。这是不可能的。
主持人:你觉得DeepMind的不足在哪里以及制约DeepMind发展的因素是什么?
Luke:我觉得现在的机器学习的表现是令人咋舌的,不过发展也就只是机器算法而已。如果我们想继续发展下去,我们必须加入很多其他学科的理念和理论,例如神经学、心理学、哲学以及等等。这样我们才能发展处下一代的人工智能, 不然再好的算法也终将是算法。
观众互动:
观众: 您刚刚谈论的人工智能和工作之间的影响,我想展开一下。您刚刚只讨论了某些高新的特殊职业例如医生,那么对于那些底层的蓝领工作者,比如麦当劳的员工以及快递员,这些人群也是十分巨大的。在人工智能替代人类工作的趋势中,医生能轻松转型成为治疗师之类的,而底层工作者的机会却不这么多,您怎么看待这个问题呢?
Luke:我觉得只要是人,就能找到工作,而能力不是存在于你的简历或者学历。技能可以继续学习,工作能否尽快找到就在于当下你学习技能的快慢,以及顺应潮流。
主持人:我的想法也差不多。举个例子,就是伊隆马斯克找到的一个工程师并让他参与Tesla ModelX的设计,他曾经是一个机器人专家,马斯克找到他时,他毫无自信说:“我都没有参与工业界项目的经验,我恐难当大任。”马斯克却说:“要的就是你这样的人, 毫无经验,你就不会被条条框框所限制,就能发现我们看不见的东西 。”
观众: 就像你们正在做的事情,就是对各行各业的高新科技进行评估然后投资。那么一定有某家公司或者某位研发者的某个金点子让你瞬间爆炸,你能告诉我们是怎样的点子么?
主持人:哈哈哈,谁能让Luke Nosek瞬间爆炸呢?
Luke:(开始打太极)如果真的是让我瞬间爆炸的点子,因为我在投资公司,这也许是商业机密,所以也不能告诉你。
主持人:(开始救场)那你就抽象地说说呗。
Luke:(什么鬼……)但是硬要说的话,我只能很抽象地描述一下。想出这样点子的公司一定是我们能看到他们有十分有创造力的前景,比如自动驾驶系统,我们就能看出它有很多闪光点能在未来为我们人类做出很大贡献。
观众: (就是不放过你)恩,我打断一下,这个真的确实十分抽象。
主持人:(救不了你了)哈哈哈哈~
观众: 你就直说一些你觉得很赞的理念或者想法呗,不一定要是某些公司的案例。
Luke:那我就说一下吧。最让我感到惊讶的就是 人类的思维理念 ,而现在我们正处于理解人类思维以及怎样提升人类思维的十字路口。而人类思维的潜力我相信是巨大的,也许也比我们想象中人工智能的潜力还要大。这个课题贯穿很多门学科例如教育学、心理学还有很多实际应用中的工作,我对此十分兴奋。
亚马逊机器人首席技术官Tye Brady:我对机器人的五点感悟
照片上开拖拉机的是我父亲,他是密西西西比的一位伐木工。大萧条时期,刚十二岁的他不得不进入丛林去努力工作来养活家人。
我本人在技术领域工作了25年,遇到那些经历过大萧条时期的人们,我总爱问他们一个问题:“你觉得对你人生影响最大的一项技术是什么?”我父亲的回答是:“拖拉机、冰箱,还有飞机。”比如照片中的那台拖拉机,有了它,不需要再用人力或牲口犁地;至于冰箱,能让肉储存更长的时间,这对食物短缺的时代是至关重要的。所以,大家可以看到,这些技术对生活的影响都是非常直接的。
但至于飞机,我觉得很奇怪,又问道:“我说的是影响你自己生活的技术!”,他沉默了一会,答道:“儿子,当我四十岁的时候,我第一次从报纸上听说飞机这种东西,我当时很难相信一部机器载上人就可以像鸟一样飞到天上。”直到他亲眼看见一架飞机,看见它如何起飞降落。 “我虽然说不好飞机对我的日常生活产生什么样的影响,但我知道,它将改变这个世界。”
由已实现的非凡科技所带来的的巨大的变革,我将这种现象称为“完美的边界“(the Boundary of Awesome)。技术是用来满足人类需求的,包括机器人。
我个人对机器人的定义是:一种安装了计算、传感、驱动系统的物理装置,以在物理环境中完成一项或多项的智力行为。
高等智力行为表现在对未建成环境的改造,辅以快速做出高级决策的能力。 这种智力行为在初期的时候是预先设定好优先级的,后来发展到完全自动化。
机器人非常酷,我很高兴我自己的工作是每天和他们打交道。作为亚马逊机器人部门的首席技术官,我的责任是发掘、改进、应用相关技术,来使我们的员工、公司业务获益,当然,最重要的通过技术和新产品来改善用户体验。
我们的总体目标是通过应用智能技术制造吃更好的机器人,并以此扩展人类的能力,同时改善我们的工作、生活、娱乐环境。 这个目标贯穿我们工作的始终,尤其在低成本高效处理用户订单上。每当用户点击“购买”按钮时,神奇的事情就开始发生了,只是用户们很难看到而已。你订购的商品存放在亚马逊各地的仓库中,并会为用户选择最佳的“订单处理中心”(Fulfillment Center)。
如果你有机会去我们的订单处理中心参观,你会发现所有的机器人、人类同时有条不紊的并行工作,互不干扰,就像在演奏一首人机交响曲,场面令人震撼。机器人们现在已经取代了很多以前必须由人类去完成的工作,而且效率要高得多。我们的技术原理其实很简单直接:我们让货物过来找人,而不是派人去找货物。通过这套系统,我们能保证亚马逊的物流系统可以以极高的效率运行。
至于整套系统是怎么工作的,大家可以看下面的视频。我想先介绍一下系统中的组成部分。这种橙色的机器人是“运输单元”,它负责搬运仓库中的黄色货架,货架上塞满了货物,什么形状的都有,而且有些是随意摆放的。亚马逊的仓库里有成千上万这种货架,机器人能准确识别需要搬运的货架,在预先设定好的最优路线上行进,快速且不会相互干扰。
亚马逊的订单处理中心面积非常大,约120万平方英尺(约合11万平方米),约28个橄榄球场那么大。这些机器人会按订单顺序排队来到工作人员身边,将目标货物所在的那一面朝向工作人员,以便他们拿取对应货物。
感谢我们的员工和机器人们,他们让亚马逊的订单处理能力前所未有的强大。在刚过去的高峰期中,我们达到了每秒处理500件货物的水平。如果把所有亚马逊搬运机器人所走过的路程加在一起的话,可以突破一个“1”,当然,单位很重要,毕竟在座的都是工程师:一个天文单位,这是地球到太阳的平均距离,约1.5亿公里!从今年起,我们的机器人该往回走了。
最后想说一下亚马逊机器人的团队,他们是一群极富创新精神的人,敢想敢做,很多亚马逊已部署的机器人都是由他们设计制造的。他们中的大部分人都在波士顿和西雅图工作。我能与他们共事是我一生的荣幸!
好了,既然今天是EmTech数字峰会,而且主题是人工智能,我就来分享一下自己对机器人前景的五个观察。
首先是,机器人应该在人类身边,而不是远离。 机器造出来就是为了满足人类的需求,只有当它们在身边是才能为你服务。比如手机,它也是高科技的产物,而且人们总是把它带在身上,以便随时随地的获得信息。人们拥有了一部随身携带的电脑,改变了我们的行为习惯,这才是改变革命性的。机器人也是一样,它们必须融入到人类的生活环境,但挑战在于,怎样快速融合?AI技术就是这一融合过程的催化剂。
其次,机器人应该很容易使用,而且不分男女老幼。 道理很简单,某个产品被使用得越多,就会有更多的人去改进它,反之亦然,一个良性循环。AI技术将用于开发更方便、更自然的互动界面,不管你是对机器人说话,还是指点,或是碰触,总之,在人与机器人之间,必须有一种自然的行为方式。比如亚马逊的Echo,我自己经常使用,我妻子也是,我孩子也是。如果我们家的狗也会用,我想她会天天在网上订购肉骨头,这我可不干。
第三,机器人应该为人类创造一种学习环境,这点很重要。 允许人类有很好奇心,允许人类了解机器人的能力,允许人类将他们认为合适的工具用于合适的场景。创造一个学习环境来让人类以最自然的方式去了解机器人的功能。AI技术将是建立这种学习环境必不可少的,人类将把AI作为了解机器人,以及赋予其更多功能的入口。
第四,机器人应该以可预测的明确姿态去完成任务。 人类应该完全清楚机器人的下一步行动,这样才能建立人类与机器人之间的信任关系。AI将用来建立双方间的意向及状态的双向分享机制,AI要学会预测下一步行动,不管是人类的还是机器人的,这样才能使得人类与机器人的关系透明化。
最后,机器人应该以简化事物及增强人类能力为直接目标,简单的说就是让人类生活得更轻松。 比如,亚马逊的运输机器人只负责一项工作:搬运货物。把这项工作做到极致后,带来的效果就是订单处理效率的极大提升。AI在这里的作用就是分配任务,让机器人去做它们擅长的事情,而让人类集中与那些需要大量脑力的重要工作上去,然机器去延展人类的能力。
百度首席科学家吴恩达:人工智能将和电力一样具有颠覆性
主持人:作为掀起深度学习革命的先驱之一,你是在何时意识到,深度学习可能会跨过人工智能的门槛?
吴恩达:我记得我在 16 岁的时候,第一次写出自己的神经网络。但很长一段时间里,我对神经网络都没什么信心,因为它并不怎么管用。直到 2009 年的时候,这是个转折点,我的同事 Adam Coates 给我展示了他自己写出的图表。那张图表使用一个深度学习模型,并将它不断扩大。他发现,模型被扩展得越大,输出的结果就越准确,而整个系统不过是从一个小模型演变过来的。所以那时我想, 构建更加庞大的系统,可能是一个能够成功的思路 。于是我找到 Sebastian Thrun,他那时在 Google X,我问他能不能提供给我一些 Google 的机器,他说好啊我们一起做,于是后来就有了 Google Brain 项目。
主持人:这故事的最后一部分我还真没听过。这段时间,百度在对话型交互界面上有了巨大的突破,从商业角度上看,为什么语音交互界面对百度如此重要?要在效率和灵活性方面取得进步,会面临哪些挑战?
吴恩达:事实上,很多人低估了 95% 语音识别率与 99% 语音识别率的差别,这四个百分点的微小差距能够改变游戏规则:现在,只有少数人偶尔使用手机上的语音交互设备,然而如果我们达到 99% 的准确率,语音交互系统就会成为人们在使用产品时不可分割的一部分,人们会不假思索地使用。自去年以来,百度用户中使用语音助手的数量已经增长了三倍,我们肯定经过了快速弯道。随着语音识别技术越来越可靠,就会接近采用曲线(adoption curve),不久就会有越来越多的人与手机、电脑对话,甚至都不用考虑。
我经常想到智能手机触摸屏,它改变了一切,乔布斯没有发明触屏(可能是HTC第一个发明的触屏电话),但是,他让触屏智能电话运行得很棒,你会不假思索地使用它,这改变了一切,因为这是一种全新的人机交互方式。我认为,几年后,语音交互也有这样的潜力,将来我们都会不假思索地以语音的方式与电脑、手机等智能设备交流。
主持人:近年来智能系统在商业中的应用越来越广泛。你认为商业公司战略应该如何与时俱进,适应智能系统的普及?
吴恩达:这个问题很大,要花很多时间谈这个问题。我认为, 人工智能是新的「电力」 。一百多年前,电力的使用完全改变了一切,产生了许多意料之外的后果,例如,电力让冰箱成为可能,冰箱改变了食品供应系统,发电机也改变了产业建立方式。我认为, 人工智能也会产业相似变革影响 。目前,我们正处在这一阶段,许多公司正在首席数据执行官,以后可能还会雇佣人工智能执行官,来管理掌控一切的人工智能。而这与当时许多公司「电力VP」的角色十分相似,因为在当时,电力系统对人们来说太复杂了,以致于必须要由专人管理。目前,我们也是这样。这种策略有很多价值,如果你不十分确定怎么做,可以雇佣数据执行官或者人工智能执行官帮你搞定。
在接下来几年,会发生另一种变革: 人工智能会具有战略决策般的重要性 。举例,另一个对产业影响与之类似的变革,就是互联网的发明,当时首席信息官负责处理互联网之类事宜。我们意识到, 互联网的发明从根本上变革了我们对创立公司方式的看法 。人工智能会带来类似的转变。比如,现在,数据是许多公司的防御门槛,技术相对容易进行某种复制,但是数据是很难复制的,因此,你们公司的数据战略是什么?有时我们推出一个产品,部分原因在于我们喜欢这款产品,部分原因就是为了收集足够的数据,获取信息,为以后要做的事情做准备。
这就是战略计划的一部分,计划推出项目的先后顺序,先做什么,获取数据。我认为,一家领先的公司已经开始思考这样的问题。许多公司曾经希望自己早点思考互联网战略问题,就像很多年前一些公司希望早点设计出电力战略一样。现在正是考虑公司的数据战略的好时机。
主持人:我们现在的大学,能够培养足够的人工智能工程师来满足市场的需求吗?
吴恩达:可能仅靠大学,无法提供如此多的专业人才, 所以许多在线学习平台,如 coursera, Udacity 等等平台能够帮助我们解决这个问题 。
主持人:听说,中国大城市的交通情况很让人头疼,我们的一位同事前段时间体验了百度的无人车,他的感受是,中国的道路真的是很难开,百度训练无人驾驶车就像中国司机一样夸张。你认为,在中国开发无人车,有什么在美国不会遇见的问题吗?
吴恩达:中国交通的确让人头疼。有一次我们在五环高速试行无人车,一辆车突然就开到我们前面。如果是我的话我早就撞上去了,但是当时,汽车猛地停了下来。我还跟坐在驾驶位的同事说,哇你技术真好,刚才太危险了,人类接管了汽车,他说,我什么都没做,车自己停下了。这可能就是你刚才提到的那种体验。
我想和大家分享一个洞见:为什么我对百度的自动驾驶战略表示乐观。
例如,当我独自开车时,旁边的建筑工人可能会对你做出「停车」的手势,这时,你必须停车,如果做出「加速通过」的手势(类似召唤你过去的手势——译者),你最好开过去。对于无人车来说,它需要非常准确地判断这两个十分相像的手势,因为它们的含义是完全相反的。这时,99.99% 的准确率才能保证一切运作正常。
根据现在计算机视觉技术,区分这两种手势需要辩证能力。这就是为什么我认为现在绝大多数组织思考自动驾驶汽车存在的误区, 自动驾驶汽车不仅仅是自动化,也需要轻微改变汽车的基础结构 ,比如给建筑工人无线麦克风,与自动驾驶汽车交流,搞清楚汽车传达的信息。如此以来,可能不久以后,自动驾驶汽车就可以上路了。
主持人:作为一名父亲,我很关心未来的教育和就业情况。你有什么建议给家长们,让他们帮助孩子更好地就业?
吴恩达:像所有技术革命一样,人工智能会替代许多职位,也会创造许多职位。我能给各位家长的建议是, 帮助你的孩子学习如何学习。随着技术更新换代越来越快,最重要的是拥有学习的能力,这样一个人才能不断地适应环境的变化,始终在需要人类的岗位上发挥价值 。
主持人:你谈到了技术性失业这个主题,不过,目前在硅谷,一个特别热烈的讨论是,工作机会的有限是不是一种永久性的结构性有限,硅谷的解决方案是 universal basic income,意思是 每个人出生的时候就有收入购买所需 ,这个概念可以追溯到经济学家米尔顿·弗里德曼,在你看来,无论工作机会是否有限,这种统一基础收入的解决方案是否会有意义?
吴恩达:以后可能出现的失业潮,可能会更加迅速。之前,当农业渐渐被机器取代的时候,农民们尚可继续耕作,而他们的孩子转而学习别的技能。未来,从事司机等职业的人,可能在他们有生之年就会面临失业。我认为,有一种与此类似的方法可能会很有帮助,那就是, 对于结构性失业的人,我们不发放「失业补助」,而是发放「学习补助」,让人们通过学习来赚钱 。因为我相信,每个人都有通过自己的努力来创造更好的生活的权力。对于因智能系统的普及而失业的人来说,让他们能够学习其它更加需要人类的技能,能够帮助他们继续他们个人的发展。
主持人:你认为对于当前的机器学习技术来说,可能存在什么样的局限性,可能出现什么样的难题?
吴恩达:目前,任何的机器学习系统使用的都是监督式学习,而实现监督式学习,我们需要大量的数据。例如,我们在百度训练语音识别系统的时候,我们使用了过去整整五年的语音数据和相应的文本数据。所以, 对数据的庞大需求 是机器学习的阿喀琉斯之踵。我希望以后能够出现新的技术,使得机器学习能够从更少的样本中学习。
观众问答:
观众: 我感觉对于人工智能在市场上的应用,工业产业常常被忽略,那么你认为人工智能对工业产业会有什么影响?
吴恩达:我认为事实上没有什么产业是不会被人工智能所影响的,其中有很多是我们现在难以想象的产业。在互联网刚刚兴起的是,不论在百度还是谷歌,我们投放广告的方式是,雇佣专门的人员,他们需要和广告商讨论,寻找与之匹配的、用户访问量高的网站,然后把不同广告放到不同的网页去。后来,我们开始使用数据来帮助他们进行分析。到现在,我们几乎完全依赖机器学习系统来自动匹配广告和网页。但在一开始,那些工作人员是绝对不会相信机器能够取代他们的工作的。同样,拿服装零售业举例,以前,销售人员需要分析什么款式、什么颜色更符合用户的需求,他们需要预估一件产品的销量,现在,很多公司已经在使用数据来帮助它们分析了。
观众: 目前在语义理解方面,我们的进步十分有限,你觉得什么时候才会出现拐点?
吴恩达:目前,我们已经能够使机器学习类比,这虽然只是非常基础的一步,但我确实相信我们能够一步一步地达成目标。其中,大量的数据是必要的,我相信这也是儿童学习的方式。算法也是十分重要的。我们确实非常需要一种新的算法来解决这一问题,但就我个人而言,我还不知道这种算法会是什么样的。概括地讲,大数据、更好的算法、以及强大的硬件,能够帮助我们进步。
特斯拉研发的负责人Sterling Anderson:特斯拉自动驾驶将在Model 3之前推出
当Tesla在2012年推出Model S时,这部车的主要卖点之一就是永久移动网络连接。如今,此功能将成为Tesla在自动驾驶汽车竞赛中的一个重大优势。
通过网络连接,Tesla可以从车主车内所带的探测器中下载各种数据,例如车主的开车习惯以及路况。这些数据则可以被用于测试Tesla的自动驾驶软件的效率。Tesla公司甚至曾经秘密的把自动驾驶软件下载到车主的车里,在不控制车的前提下测试软件在真实路况上的反应。
“我们可以从车里下载高分辨率的数据,并且可以通过OTA(Over The Air)来升级这些车辆。这个功能使得我们在过去的18个月里,从开发竞赛的尾巴追赶到如今拥有这些非常先进的自动或半自动驾驶功能”。Tesla自动驾驶项目总监斯特林·安德森(Sterling Anderson)在旧金山《麻省理工科技评论》EmTech Digital大会上如此宣布。
“自从在18个月前推出这些硬件以来,我们积累行驶了7.8亿英里”,安德森说。“我们可以在自己的服务器上使用这些数据来观察车主们是如何使用我们的车辆,以及我们如何可以提高自己。”
安德森还表示,Tesla每10个小时就可以获得1百万公里的数据。Tesla的工程师们在开发自动驾驶软件的初期时,就会把软件的结果和这些数据比较。任何表现良好的软件可以被秘密的安装在车辆里来做进一步的测试。在不控制车辆的前提下,软件对真实路况的一切反应将被记录下来。
“我们经常会在已售车辆中安装一个‘惰性’功能”,安德森说,“这将允许我们观察一个功能在千万英里的实况下表现如何。”
当一个新的功能被推出时,安德森的团队也可以紧密观察它的情况。就拿Tesla的Autopilot功能来说,安德森展示了一个图表。图表显示了在Autopilot的控制下,自动驾驶的Tesla汽车比人类驾驶更加贴近车道的中心。自从去年10月正式推出以来,Tesla的自动驾驶功能已经积累了1亿英里。
可以 随时 随地的从车里下载数据,以及秘密的测试自动驾驶功能是属于Tesla的独门绝技。谷歌曾展示过最先进的自动驾驶技术,但是他们也只能从数量极少的原型车里下载数据。相比之下,Tesla的车辆不但在数量上超过谷歌,在区域的广度上也完全超越谷歌。
其他汽车厂家,例如通用汽车,也在试图开发自动驾驶技术。但是他们并没有像Tesla一样欢迎网络连接和OTA升级。
前不久,马斯克刚刚宣布,廉价版的电动车特斯拉Model3会在2017年晚些时候面世。其内饰和轮毂的设计依旧没有盖棺论定,马斯克在自己的推特里,也提到了车辆设计方面的不确定性,以及Model3“宇宙飞船”般的驾驶体验。宇宙飞船?这究竟意味着什么?难道这是关于特斯拉,乃至全世界,第一部无人驾驶汽车的高能剧透?
当Sterling Anderson,特斯拉无人驾驶部门的负责人,被问及Model3会不会是人类历史上第一部无人驾驶车时,他“驳斥”了这种观点:“ 这种事情,在Model3问世之前,就应该发生了 。”
“Model 3不会因为价格的原因缺失任何我们所拥有的技术,它会代表我们的最高水平。”Anderson表示,特斯拉是独一无二的公司,它会将所有已经掌握的新技术,运用到所有正在生产的车型上,也就是说,所有特斯拉电动车在出厂时,都拥有当时特斯拉最先进的技术,“ModelS和X的技术水平也会一直进步下去。”
这预示着,也许特斯拉Model 3不会成为第一部无人驾驶车了,因为一旦特斯拉掌握了让无人驾驶(自动巡航)的技术——不仅仅针对高速公路,而是全路段——他们不会等待Model 3的问世,而会将这项技术直接加载到现有的车型中。
Anderson说,他们的无人驾驶研发团队目前正在尝试解决 郊区行驶问题 ,以及如何处理十字路口情况的问题。他的说法也符合目前特斯拉在无人驾驶方面的计划,以及研发现状的报告。
以特斯拉Model S为例,它在2012年开始发售,当时并不具备自动驾驶所需要的传感器和其他硬件;到了2014年晚些时候,Model S增加了自动紧急刹车系统以及相关传感器;而2015年,Model S又增加了一项人工开启自动巡航的功能。
按这个速度下去,无人驾驶(自动巡航)指日可待?
阿兰·帕克尔(Alan Packer):Facebook计划在今年使用神经网络来提高翻译水平
Facebook正在试图大幅提高它自动翻译的精准度。 他们准备在年底推出一款全新的,基于人工神经网络的翻译系统。人工神经网络是Facebook以及其他科技公司花重资所开发的人工智能新技术。
在麻省理工科技评论EmTec Digital峰会上,Facebook语言技术部部长阿兰·帕克尔(Alan Packer)表示, 使用神经网络所得到的翻译结果要比统计机器翻译所得到的结果更加自然 。目前,绝大多数翻译软件所使用的都是统计机器翻译。
帕尔克还表示,神经网络在把俚语和比喻翻译为其他语言中相似的说法这方面可能更加出色。
谷歌也正在向神经网络上转移谷歌翻译,但是目前此项目还没具体的时间表。
Facebook和谷歌两者都有庞大的数据可以用来训练翻译软件。但是Facebook的数据可能更加口语化,更加贴近人们聊天的方式。
目前,Facebook上有大概2万亿个状态和回复。而且这个数字正在以每日10亿的数量增加。帕克尔曾解释过他的团队是如何使用这些数据来训练他们的软件,去翻译口语化的单词和句子的。
就拿数月前的一个发现来说。那时,Facebook有探测到法国学生正在使用各种英语单词的变种,例如“wow”的变种“uau”。Facebook的机器学习软件成功的学会了这些,并开始正确的翻译这些变种。帕克尔表示,Facebook目前可以翻译40多种语言,每天提供高达20亿次的翻译。每个月都有8亿名用户在Facebook上浏览翻译的语言。
但是有一种及其受到欢迎的语言帕克尔没有任何兴趣翻译——表情符号。
“它们一般都是通用的“他说。
Gary Marcus:一味追求大数据是机器学习的误区,我们的算法所需数据更少且速度更快
去年,微软和谷歌的图像识别算法都已表现出可通过学习打败人类的能力。他们各自搭建了自己的软件,进行了标准测试,让软件识别1000张各式各样的物体的图片,结果超过了平均的人类得分。
但是,为了让软件足够强大能够对抗人类,这两个公司的软件都对120万张带标签的图片进行了仔细观察。而对一个孩子来说,只用一张样例图片,就能够识别一种新的物体。
日前,创业公司 Geometric Intelligence 说,他们研发了一个可以更快学习的机器学习软件。该公司的 CEO Gary Marcus 在EmTech Digital 大会上表示,如果要学习一项新的视觉任务,他们的 XProp 软件所需要的样品图片数量与现在机器学习软件的主流形式—— 即深度学习相比要少得多 。
Marcus 没有披露 XProp 的工作细节,但他展示了一张将 XProp 和某个深度学习程序在一项测试中的表现做对比的表格,该测试的内容是软件学习怎样识别手写体数字。
表格显示, 训练数据越多,两个系统性能就会越精确 。但是在相同数量训练样例的情况下, XProp 的性能表现得更好。
比如,XProp 学习过每个数字的大约150张手写图片后,识别新的数字图片,错误率只有约 2%。而对深度学习算法来说,为达到同样性能,则每个数字需要学习约 700 张样图。
这并不代表 XProp 一定有实际用处。识别手写体数字差不多属于已解决的问题了。可用来训练的数据很多,而用深度学习软件得出的最好结果错误率已经达到了 0.2%。Marcus 展示的数字显示,随着训练数据的增多,XProp 相比于深度学习软件的优势就会下降。
但是 Marcus 说,在谷歌街景项目收集的门牌号码照片的数据库中,XProp 的识别结果与上面那个实验相似,其他的图像识别测试中也是如此,这表明,该公司的技术可能具有广泛的可用性。
大多数机器学习研究人员都认为会出现一些能够通过学习更少的数据运作起来的新技术。
Marcus 说:“深度学习非常需要数据——而我们的学习速度则更快,我们的软件有时可以将所需数据量减少一半,有时甚至更多。”
Marcus 是纽约大学的心理学教授,曾用几十年时间研究儿童的学习方式。他目前最困惑的一个问题是,语音及图像识别等由深度学习支撑的领域进展是否一定会帮助理解语言等更有挑战性的领域的进步呢?
谷歌这样的大型计算公司通过将海量的标签训练数据集结到一起,已经有能力打造强大的语音和图像识别软件。Marcus 不否认这类科技将会带来成功的产品。但是,他相信, 如果软件的性能要更加接近人类快速学习新技能,以及适应不断变化的环境的能力,那么需要更少数据量的算法就必不可少 。
“我们处在大数据的时代,而且很多人觉得只要投入更多数据就能解决问题,”Marcus 对 EmTech 的观众说,“但是面对有些问题的时候,并没有那么多数据可以提供。”
他说,语言就是其中之一。 人们的言语有无限种可能 ,将所有含义的语句归纳出来训练软件是不可能实现的。Marcus 还提到了无人驾驶汽车的例子,机器学习算法需要大量数据,在无人驾驶汽车中,这可能无法解决所有问题。
他说,如果一辆汽车必须一遍遍地体验环境才能掌握技能,那么用每种可能的交通和天气情况训练车辆,可能耗时太长。