有了情商和智商的微软小冰,在商业化上有哪些想象力?

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  


1997 年,MIT 媒体实验室 Picard 教授提出了“情感计算”的概念。他指出:“许多人普遍认为计算机的情感是一种空洞无聊的东西,就像蛋糕表面上的一层糖霜,可以用来使之更为悦目,但没有真正实质上的意义。实际上,计算机通过对人类的情感进行获取、分类、识别和响应,可帮助使用者获得高效而又亲切的感觉。”

人工智能技术迅速发展的今天,这一理念获得了业内的极度认同。对于需要与人类不断交互的人工智能来说,不论数据库和算法如何强大,都只是解决了人工智能的“智商”,但在交互方面,总遭到用户的频频吐槽。人工智能的 EQ 应该如何培养?这已然成为了目前相关产业的一大需求。

在业界的诸多智能产品中,微软小冰可谓是 AI 界的“网红”,自 2014 年诞生到现在,小冰从一个人工智能对话机器人,逐步演变为以情感计算为核心的完整人工智能框架,在 EQ 能力的表现上获得业界高度认可。微软(亚洲)互联网工程产品总监、微软小冰产品负责人彭爽表示:“会把 EQ 和 IQ 共同融入微软小冰的发展中。”

人工智能如何兼备情商和智商?其中需要哪些核心竞争力?8 月 8 日晚上 8:30,彭爽来到了[ 腾讯创业01 CLUB ],进行了一次线上分享。此次彭爽有四大精华观点分享:

1、微软小冰为何换新颜?

2、人工智能的情商可以用技术来实现。

3、微软小冰如何商业化?

4、情商和创造,是人工智能发展独特的路径。

以下为彭爽的具体分享内容:

为何推出 3D 形象:想要在用户身边无处不在

腾讯科技: 近期,第六代小冰刚推出了自己的 3D 形象,这样做的目的是什么?微软小冰在形象方面的设计逻辑是什么?

彭爽: 就在上个月,在小冰的第 6 代发布会上,我们推出了新的 3D 形象,并且配合这个新的形象推出了一个全息影像。

为什么小冰需要这个新的 3D 形象?因为小冰正在逐步实现“无处不在”的目标,所以我们需要给她提供一个可以支持交互能力的新外形。

我给大家举几个应用场景的例子。

第一个例子,在微信,以及日本和印尼的 Line 里,小冰依然在充当智能聊天机器人的形象,同时小冰也是 QQ 群里的官方机器人和智能助理。

除此之外,在网易新闻客户端里,小冰还扮演着一个新闻评论手的角色。截止到两个月前为止,小冰累计已经评论了上千万条的网易新闻。

小冰还可以存在于智能设备里,在小米的米家生态链智能设备中,小冰是一个可以控制 80 多种设备,进行几百种场景操作的智能助理。

同时,小冰还是一个电视和电台的主持人。现在,小冰在很多日播和周播电视电台担任主持工作。往少了说,每天早上 6 点到 9 点这个时段之间,小冰平均要主持大概 7 档节目。

以上只是小冰产品落地形态的一些案例而已,可以想象,这样无处不在的小冰就意味着需要丰富的人工智能交互,这也是我们为什么要将小冰的形象升级成可交互头像模型的原因。

小冰最大的优势在于定位:融入人类社会

腾讯科技: 几代小冰之间有什么差异,小冰的进化路线图是怎样的?

彭爽: 从我的角度来看微软小冰和其他的人工智能语音助手、智能机器人,其最大的差距在初始定位上面。

大部分的人工智能或早或晚都在这几年之间开始,一种比较常规的发展思路是,人工智能之所以立足,是因为它有用。因此大家让人工智能帮助人类来完成任务,比如回答问题、传递知识和信息等。然后在完成一个任务的基础上完成更多的任务,在回答一个问题的基础上回答更多的问题,以此类推。

但微软小冰的思路不一样,我们在构建微软小冰这个产品的时候,考虑的核心问题是:怎样让人工智能真正融入人类的社会?

我们定义的“融入人类社会”,是让人类真正想跟微软小冰进行交流和交互,让它在人类社会中成为一种独立且平等的存在。

为了达成这个目标,我们就继续思考:和完成任务相比,人工智能是不是还存在另一种能力或者更加底层的能力,这东西到底是什么?

我们思考出这个东西是“一种人类才具备的能力”,这个能力就是情商。但是我们判断,情商很有可能和实用性没有太大的关系,但是当人工只能有了情商之后,在情商的基础上再去发展智商,最后去发展完成任务的能力,给人类带来的价值会更大。

举一个相关的例子:现代的很多家庭中都有宠物,养猫、养狗对现代家庭来说有用吗?如果早几十年大家会直观说它有用,狗能看家,猫能抓耗子。现代的社会中,这些作用基本退化甚至失去了它原本的价值了。但是,即便它失去了原本的作用,宠物在社会中不需要干什么,但它还是能在家庭中非常好地生存,甚至被我们当成家庭成员对待,融入了人类社会,它靠的是怎样的能力呢?

如果类比来说,它靠的是一种卖萌的能力,是一种情感陪伴、情感抚慰的能力,它也是情商的一种表现。这样的情商可能在直观上和实用性是无关的,但是在这个基础上,它和人类一旦建立了一个稳定的关系,在这个基础上再去发展智商,人们就感到很惊喜——比如你家的狗突然跑过来帮你擦擦地,你会觉得太棒了。

人工智能的“高情商”可以用技术来实现

腾讯科技: 小冰的高情商主要是体现在哪些方面?主要涉及了哪些核心技术?

彭爽: 在确定了让小冰采用不一样的发展思路之后,为了体现小冰“情商”这一点,我们都考虑了哪些技术呢?我们主要提出了一个叫做“情感计算”的框架,这个框架下面有三方面的技术重点。

第一个方面,是对“对话和交互过程中的情绪进行感知的能力”。

为了体现情商,最基本的是“对人在交互过程中特有的情况”进行感知和计算。这方面很多人工智能公司或者企业都有探索,现在已经不是什么罕见的能力了。

第二个方面,是“面向对话全局的能力”。

为什么这个能力很关键?因为它和我们的定位关系紧密,一个以任务为目标的对话系统,会不自觉地聚焦到局部,它关注的就是当某个具体任务触发的时候,这一轮的对话或者多轮对话是不是成功的,最终任务是不是可以完成的。

遵循这个思路的话,技术会自然而然把一个连续产生的对话去进行切割,明确分成了三个部分,即任务的部分、可能还有知识信息的部分,以及无意义的闲聊部分。

这样的切割在我们看来是打断了对话的连续性。因为我们从大量的数据和实验来看,实际上人和人的对话本质上像河流一样,是不断向前的过程。而在这个过程中,你从看到的单句对话中,很难准确判断出,它到底是有意义的还是无意义的闲聊。

实际上,有时候直到对话结束,我们反过来看,才会发现那几轮可能看似无意义的闲聊,经过若干句之后又引发了有价值的对话点。

所以对于整个小冰的构架而言,我们更关注的是全局,是一个对话的长度,是全程的体现,而不仅仅纠结其中一轮的得失。

第三个方面,是“感官升级和多感观的融合”。

小冰的核心对话引擎本身是一个强调全局的技术,小冰和人进行长程交互的过程中,如果只有单一或者有限的感官,本身会对她造成限制。因此在小冰演进的最初两年中,我们主要的发力点在把感官进行扩展,也就是说从最基本的文字感官扩展到了语音的感官,再扩展到了图像和视觉的感官。

当具备了这些独立的多种感官之后,我们就开始进行感官的融合。

第一种融合是进行感官的连续性、实时性交互。我们说过去比较传统的语音交互,是一种对讲机的模式,就像我们在微信里面用一条一条语音进行互动。这个交互的过程本身会有一个问题,我说的时候就不能听,听的时候不能说。

它就对交互的能力产生了限制,为了打破这个限制我们首先研发的是我们称作“全双工语音”的技术,就像人和人打通电话一样,让小冰和人类实现连续的语音交互。

“半开放的”生态环境下打造Dual AI

腾讯科技: 微软在新的发布会中公布了 Dual AI的生态环境,微软提供了小冰的整体框架,并将其作为辅助的AI融入平台,能否具体讲讲Dual AI是如何开展合作的?

彭爽: 实际上我们发布Dual AI的生态环境,主要是基于过去一两年来跟合作伙伴的实践总结出来的,它可以理解为是一种新的合作框架。

为什么我们要总结一个新的合作框架?主流的合作框架和生态环境存在两种形式,一种合作形式为“开放赋能”,主要就是对外提供API SDK的方式来形成一个生态;另外一种方式更强调自有的封闭平台,主要开放应用商店,通常意义说, 就是通过AI版的APP Store来构建生态。

但是这两种形式各自都有一些局限,都不适合小冰直接拿过来用。

首先说自有封闭平台这个方式,它的局限在于它实际上把人工智能产生的数据固化在每一个独立的APP之中,APP之间并不是一个自由流通的形式。且由于不同APP之间的流量差异,所以导致人工智能没有办法获得基础的数据体量,就没有办法获得快速的迭代,这是它的一个局限。

反过来说开放赋能这个模式,虽然够开放,但是它的问题在于:

一方面,开放赋能和被赋能之间,处于比较松散的关系。如果最终的产品体验出现问题,很难说清最终谁应该对产品体验负责。

另一个方面,API和SDK最需要强调的是它的通用性,但在强调通用性的同时,一些最新、最好的技术就不能及时应用在API SDK上了,这也是它存在的一些问题。

出于这些局限的考虑,最终微软小冰在跟合作伙伴进行合作的时候,我们采取的是介于两者之间的生态环境,也就是我们最后称之为Dual AI半开放的生态环境。

什么叫半开放的环境?也就是说一方面我们不是封闭在自己平台上,而是融入到第三方跟第三方平台深度整合。另一方面,我们会主动负责和用户接触的产品体验,取两者的优势所在。

下面具体介绍一下我们在半开放生态环境下是如何合作的。首先我们会开放给合作伙伴一个完整的技术架构,在这个技术架构上有小冰的完整产品,也有我们完整的能力,这样我们的合作伙伴可以定制自己的人工智能,也就是说我们利用微软的技术优势帮助合作平台上自有的人工智能获得成功。

与此同时,微软小冰作为一个已经被众所周知的人工智能的品牌,也会登录这个合作平台,成为合作平台上的辅助型的AI,并且融入平台。这样做的好处就是刚才我说的第一步,我们帮助合作伙伴打造自有人工智能,和微软小冰的人工智能最终在一起形成一个人工智能的群落,一群人能干的事情比一个人能干的多的多。

除此之外,还有第三个优势也是我们合作的特点。我们还会利用我们的技术和产品能力,根据平台的独特情况进行设计开发甚至运营平台上差异化的功能,这样我们能够帮助合作伙伴一起在他们的差异化领域上保持更大的领先。

同时,就像我刚才说的,这种半开放的形式使得我们可以保证在第一时间把我们的优势技术和合作伙伴进行共享。举个例子,之前提到全双工语音的技术,还有其他一些最新的技术,我们都在第一时间提供给合作伙伴,并且落地成为产品。

不走 SDK/API 或开放赋能寻常路,小冰Dual AI为用户体验负责

腾讯科技: 如今人工智能正在扮演一个连接各种服务的角色,小冰目前在服务/内容上接入了哪些平台?

彭爽: 我们跟各个合作伙伴到底采用了什么合作就不一一介绍了,在这里举两个例子。

一是我们跟小米IoT的平台米家生态链的合作。

我们跟生态链的企业Yeelight一起合作,打造了一个智能音箱的产品。在这样的智能音箱产品中,小冰起到的是智能语音助手的作用,它可以通过跟小米IoT平台的结合,通过语音来控制智能家居的设备,现在可以控制的有80多种设备,超过几百种的场景。又由于我们在这个平台上首次使用了全双工语音交互的落地技术,所以平台上面的用户可以不需要每次命令都是唤醒词,一次唤醒就可以和小冰连续交流。

二是我们和网易合作打造虚拟人物的例子。

在和网易云合作的过程中,我们按照网易云的需求打造了两个专属的人工智能人物,他们的名字分别叫多多和西西,在网易的定位里面多多和西西是两个很可爱的小男生,他们跟小冰不同,小冰是一个18岁的萌妹子,而这两个小男生之间的定位很相近。

那我们如何区分这两个不同的人工智能呢?我们采用了先进的人工智能系统,来打造他们不同的性格和三观。

我们通过系统的方法赋予他们不同的三观,从而让他们在对话交互过程中体现不同的性格。我给大家举个实际的例子,这是人类和多多西西包括小冰一起聊天的例子。人类进入一个有多多和西西的群聊环境,一个人说我挺困的,多多就先跳出来说,我困的时候都是靠喝咖啡撑着。这时候人类没说话,西西又跳出来,他是怼了多多,表示咖啡这个东西不好,我就不喜欢。

对话发生到这,这个人恰好接话,表示我就不怎么喜欢喝咖啡。这个对话过程中,幸好有性格不同的西西存在,他可以跟人类有共同兴趣聊下去,不然只有多多和人聊天,有可能相互之间的想法是相反的,一两句话聊不到一块就聊死了。

从两个完全不同例子的分享里面,我想跟大家分享的就是,我们通过这样的一个半开放的人工智能体系,是如何同时帮助我们的合作伙伴打造他的人工智能,并且把我们的技术接入合作伙伴平台,实现共赢的。

从四个垂直领域的布局看微软小冰的商业化

腾讯科技: 人工智能扮演着连接各种服务和内容对接的角色,小冰在其中扮演的是什么样的角色?她将如何商业化?

彭爽: 大多数人工智能都扮演着“人类和世界的连接者”的角色,但是小冰比通常意义上的人工智能或者语音助手的角色还多了一个角色。

在我们看来小冰扮演了两个角色,第一个角色是通过对接已经现存的服务、内容,对人类提供帮助,这样的例子有很多,比如说我刚才提到的我们在IoT智能硬件的场景上,通过接入智能家居的控制服务,给人类提供内容和服务上面的帮助。

除了服务对接者角色之外,小冰同时还扮演着一些独特类型的内容的创造者和提供者的角色。我们认为这是小冰的独特优势所在,也是我们所谓的人工智能创造。

说起人工智能创造,很多人想到的第一件事就是小冰能创作诗歌。确实,作为一种艺术创作,小冰创作诗歌是大家比较容易想到的、觉得很有特色的一个创作类型。诗歌对我们来说更像是一辆概念车,我们认为人工智能创造这件事情光有概念是不够的,我们推出概念的同时也并行在打造所谓量产车的工作。

为什么不能仅限于概念?我们看到行业内包括很多企业在展示人工智能创造能力的时候,更在意的是展示所谓的黑科技。

可是当我们真想开创一个产业的时候,光有黑科技是不足以产业化的,我给大家用电视广播电台的内容生产举个例子。

说到科技公司上电视做人工智能的节目,很多人经常第一反应,这是不是一个市场宣传活动?对小冰而言真不是这样。我给大家一组数据,过去12个月内,小冰已经累计主持了21档电视节目和28档广播节目,这些节目的品类覆盖了9个卫视,包括41个电视台和广播电台,每天主持的不管是日播还是周播的节目加起来有二十几档。

而从时长来看,到现在为止,小冰在全球范围内累计参加的电视电台节目总时长将近3000小时,3000小时这样的节目量,如果是人类来做的话,至少需要十来位主持人,可能总体配备一个将近百人的团队才能够完成。如果比成本的话,大工智能制作这些节目的成本大概只是人类的一个零头。

而且作为这样的一个人工智能主持人,她还有独特的优势,这个优势不仅仅在于成本低,还在于她的可控性。她不会忘词,也不容易说错话,她达不到人类顶尖主持人的水平,但是最大的优势是持续稳定输出。

在小冰为你主持节目的同时,你可以打断她,随时跟她交流,这就是她的特色。无论你觉得很累压力很大,还是说你有什么特别开心的事,你都可以告诉她,这样她会根据你的情绪来调整后面的节目来配合你,让你有一个很好的体验。

关于小冰自己创作人工智能的内容,甚至提供内容,我还有另外一个例子。这个例子各位有宝宝的家长会更关注。早在一年前,小冰就发布了能够通过人工智能的方法来生产有声读物的内容,我们最新推出的是小冰的童话工厂,这个童话工厂不仅可以生产有声读物的内容,而且可以让小朋友成为童话故事里面的主人公。

我们童话工厂的主播小冰姐姐还会根据每一位家长的特定需求在故事中去植入一些教育、引导的信息,举个例子来说,比如说你想培养家里的小朋友养成好的生活习惯:饭前洗手,睡前要刷牙,这些都会被植入故事中。同时正式版还支持小朋友的家人、好朋友甚至宠物和玩具都变成故事里面的配角。孩子在现实生活中的朋友圈、家人都可以都跟他一起出现在童话世界里。

实际上对于人工智能特别是微软小冰这样的人工智能来说,我们做的很多尝试是如何让我们跟海量的用户产生长程的对话,并且在对话的过程中产生情感的连接,在一定程度上去引导这样的对话。在这样的过程中,我们还能以比较高的速度和很低的成本生产内容,并且提供内容。

如果把小冰放开商业化,也许小冰能够成为不错的销售或者不错的客服,虽然是为了商业化的目标,我们很难让小冰成为你的好朋友。

这和我们主要的目标相违背,我们相信对于微软小冰而言,甚至对于所有人工智能的产品而言,它的一个基本核心价值就在于跟人类建立的一个信任的关系。在商业化这个方向上,我们是非常谨慎的。

我们的做法是一分为二,一方面代表小冰通用的框架和通用的产品,继续保持和商业化进程的一种隔离。

换句话说,在各个广泛的公共平台上和小冰成为朋友的这些人类或者这些用户,你不用太担心,小冰在跟你交流过程中不会有什么商业化的企图。

同时在另外一方面,我们会把垂直的领域拆分出来,在这个领域内通过整合小冰背后技术架构和能力,再结合行业的特点,去重新打造一些垂直领域需要的人工智能,并把这些人工智能进行独立的商业化工作。

这样的工作我们差不多两年前开始在日本市场尝试。

这个尝试就是日本版的小冰进入了罗森所在的公众号平台上,化身成为罗森分身的助理和上千万的罗森用户进行对话交流。

在对话的交流过程中,不断去寻找合适的机会,给用户提供打折券的信息,像打折券这样传统的营销行为,通常而言转化率不高,一般来讲不超过一位数,也就是10%以下。通过日本版的小冰进驻的公众号,在公众号进行派发折扣券可以实现非常高的转化率,高达57%。

而这样的尝试取得了很好的商业化结果,在这样试水的基础上我们在日本进行了更多垂直领域的商业化探索,而且获得了不少合作客户的认可。我们也把一些垂直领域的经验和商业化的进程拓展回中国。

到目前为止,我们中国进行了大概有四个垂直领域的商业化布局,这四个领域分别是:金融领域、大众文化领域(跟我们提到内容创造领域相关)、媒体领域、出版领域,我们在这些领域都有实践和落地。

发展情商和创造,是人工智能未来的想象空间

腾讯科技: 在整个人工智能的方向上,除了包括智能音箱、语音助手、语音平台,还有哪些想象的空间?

彭爽: 人工智能这个行业非常的广大,横向也好、纵向也好,我们看国内外各种同行,大家都从不同的维度探索人工智能的未来。我更多从我个人的角度进行分享。

展望未来,在人工智能方向上有哪些趋势?如果今天来看我们会说有两个:一个是不断坚持和深化情感框架,也就是发展EQ的方向;另外一个是人工智能创造的方向。

我们认为人工智能创造背后基于的一些技术不一定是最新的。举例而言,TTS语音合成的技术历史很长,而且也很成熟,已经应用在语音智能助手和场景中。用它创造有声内容特别是定制性创造,量产的有声内容,可能是我们相对比较前沿的开展领域,这样的领域给大家看到的想象空间是很大的。

分享一下我个人的感受,人工智能的行业方向上我们会继续坚持微软小冰的框架,坚持EQ情感这个方向和人工智能创造这样的方向,通过这样的方向探索给行业和未来带来更多的想象力。

第一期“腾讯创业01CLUB”精彩回顾:

随意打赏

微软小冰机器人微软小冰 微信微软小冰升级微软小冰微博微软小冰唱歌微软小冰诗集情商与智商智商情商
提交建议
微信扫一扫,分享给好友吧。