将来电话的接线员可能是小冰,而这也只是微软“对话即平台”的一小步
电影编剧、导演们对于对话人工智能的所有想象大概就是《Her》电影里面那样,现在微软要向这个目标迈进。
担任这一重要角色的产品就是——升级为第四代的微软小冰。
这是那个曾经在社交平台上或伶牙俐齿、或“胡言乱语”,又险些被带进弯路的“粗俗 Girl ”么?人们对于她已经有太多印象,或许小冰本身已经没有什么值得惊讶的,也或许我们已经习惯将它称之为“她”。
无可否认的是,小冰正被提升至微软战略中的新一高度。
9 月 17 日,微软要为小冰这一人工智能产品办一场 18 岁成人礼。上周末,微软正式发布了第四代微软小冰——不同的地方在于微软将解锁小冰的全时感官,比如你可以直接给小冰打个电话聊聊天。
情感与决策
随着微软小冰的到来,所有媒体的关注点也聚焦在一个微软华人高管上。
这也基本体现微软小冰这一项目的战略高度,主要是因为微软全球执行副总裁陆奇的到场——他专门从美国飞到中国参加活动,这位高管曾就职于雅虎,加入微软后成为了微软内部华人中最高级别的管理人员。
而对于小冰,在他口中“只因小冰这个项目是一个影响战略的产品。”
Her
关于语音助手我们知道,不管是 Google Home 还是 Amazon Echo,其背后的重要技术就是人工智能——一种基于语音识别的技术, 而微软要做的就是将关注点放在“对话”上。
当然,这也并不是小冰第一次开放让人眼前一亮的聊天技能,去年微软发布第三代小冰的时候它已经可以识别图片以及语音,比如你发送一张狗的图片,她会说“狗狗好漂亮,是你养的嘛?”。在接下来每隔一段时间她也会陆续开放一些小技能,但她也被一部分用户新鲜一段时间后就搁置一边。
现在微软继续将小冰提升一代,让其拥有实时语音通话的含义。
总体来讲,微软在人工智能上的策略是“对话”—— 就是让小冰与用户之间产生更多的交流,让两者产生更像是人的连接,不管是语义、语调还是情感上。 这里微软提出了一个概念: 人工智能的 EQ 比 IQ 要重要的多 ——比如如果和某个语音助手聊天,我并不想跟一个全能领域的专家聊天,我希望她可以说“人话”,让我认为她跟我是一个有紧密联系的朋友。
微软展示的一段对话
陆奇也谈到,小冰和 Cortana 就分别代表了两个方向 EQ 和 IQ,感性与理性。第四代小冰将会继续沿用情感计算框架,判断语义、语气以及语调,最后自主决策合适的聊天策略——她甚至要判断你是不是生气了,然后采用一种迂回的对话话术让你忘掉悲伤。
在为 IQ 引入 EQ 的维度之后,微软不断发现,“情感会影响人们的决策”这件事几乎渗透在人们今天生活与工作的每个方面。无论你是在一个电商 app 里买东西,还是在一个社交平台里互动,都不再仅仅是功能实现,而是要体现出温度,体现出 EQ 的特点,这个维度越强大,这个平台的表现就越好。
“大白插卡”的商业化
事实上,小冰本身已经在小心翼翼的接触任何商业化的项目,这种商业化本身很像超能陆战队里的“大白插卡”。
微软希望可以使用小冰跟一些三方公司合作,比如面对电影平台的时候就激活对方的电影卡、面对时尚平台的时候接入时尚卡。
最能直接想到的就是将小冰直接接入各个社交平台的客服帐号,甚至微信的公众服务号等——也许将来打开 SF 的公众号,和你聊天的正是被几万 SF 用户构建而成的小冰妹子。
这基本已经呼应上了陆奇所说的“对话即平台”的新野心。
IQ EQ 技术的局限
事实上,通过我们自己的测试也发现,并不是所有语义、图像识别都能做到准确。
这可能正验证了机器学习、人工智能技术仍然有一段距离要走。
在被问题图像识别精度的问题时陆奇这样说,“这是目前世界上最领先的。图片里面识别实物微软是世界第一名,我们的错误率是 4.9%,人的错误率是 5.1%。识别实物还是初步阶段,比如里面有一个车子,一个鸟;还识别一个场景,是不是一个狗在追一只鸟;这个场景是什么,这个难度更大一点。”
AlphaGO
对于机器学习,微软认为整体的算法大概有几种大的方式——一种是拥有样本,真正做到人工智能会有非常大的限制; 比如 AlphaGo 做了他公司里面最大的创新,使用增强学习技术需要样本,它从用户使用的过程当中来学习,但是这也有它的限制 。它的限制就是你探索的环境多大,如果探索环境不大的话,学来学去,就是学一个封闭的系统,关键是要解决技术上创新的问题。
“但人与人之间知识是可以传输的。最后还要解决一部分问题,人一部分的知识并没有做增强,也没有人来教,但自己学会了。所以人的知识就是三部分把它总结起来——增强学习,这是三部分学习的方式,微软这方面的研究比较多。”
这就好比为什么人类发明了飞机?只因为我们当初去学习了鸟是怎么飞,把鸟飞的功能找到后建立了更完善的实体飞机,智能系统也一样,人类是怎样发明智能系统的? 下一个智能系统同样可以自动获取知识,代表知识,而不是一个狭义的智能系统。
小冰是一个例子,微软希望通过在机器学习、人工智能方面的投入,在微软的产品上看到下一代互联网。
“这个产品一定是带来正能量,正面影响,辅助人类,帮助人类使每个人生活更完美的。”陆奇补充道。
Google 搜索的下一时代:对话即平台
在陆奇的会上发言中,其实有很重要的一段话,这段话应该可以用来描述微软的下一个时代。
“在信息科技史上,真正意义上的大时代,曾经出现过两次。每一次都伴随着交互的革命。第一次,是当个人电脑崛起时,图形用户界面成为用户交互的接口。那个时代的推动者以微软为代表。第二次,当互联网崛起时,人们开始通过搜索引擎和浏览器与世界连接。Google 成为了第二个时代的代表。”
微软认为,今天的移动互联网和云的发展,还只是第三个时代的萌芽,只是这个新时代的过渡阶段。 真正的第三个大时代,是人工智能的时代。 而它的核心革命,就是“对话即平台(Conversations as a Platform(CaaP))”的崛起。实际上,以对话为核心的这个新的时代,在数据量、用户连接和技术条件集大成之后,更像是一种回归。
陆奇解释“回归”的含义是在 PC 普及和搜索引擎崛起的时候,人们并不是像今天这样用键盘和鼠标与机器对话、在搜索框里用关键字来搜索的。人们最初的体验,是直接和电脑说话、在搜索引擎里输入完整的对话。只是因为当时的技术条件不具备,才使人们不得不去学着使用机器能理解的输入方式和关键词来找到自己所需的东西。对话自始至终是最自然的交互形式,只是当时还不具备条件而已。
如果我们现在具备了这种条件,更应该考虑的是人与人工智能之间的关系。
在微软多次的发布会上,微软 CEO Satya 也表示将云和聊天 Bot 提升至新一战略等级。
回到微软小冰这个人工智能,微软小冰项目负责人李笛这样介绍—— 小冰其实被微软称之为一个无用的人工智能 ,她不是全能助手,她就是通过逐渐构建情感成长,最后像一个女孩一样跟用户进行沟通。
这基本带给了我们对于微软的一个新认识,在这位微软内部最高级别华人高管口中,微软可能在赌一个时代——对话即平台。
内容参考:陆奇在微软小冰发布会上的发言
题图插图来自:Google,电影《Her》,微软官方