微软解析全双工语音交互感官 微软小冰加速情商与智商整合

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

早春三月的北京,随着温度一起上升的还有各种 智能硬件 产品发布会的频率正在变得越发密集。微软(亚洲) 互联网 工程院宣布,率先推出新一代全双工语音交互感官(Full-duplex Voice Sense),并已经完成产品化落地。3月28日,微软召开了一场技术交流会,就全双工语音交互感官技术向 媒体 进行了深度解析。

微软(亚洲)互联网工程院副院长、微软小冰全球负责人李笛表示,比起主流“搭积木”式的功能发展,微软更看重人工智能基础框架的探索。现在大多数人工智能助手给人以“不够智能”的感觉,普遍采用的是传统以单一任务为目标的Turn-oriented框架。“Turn-oriented框架下每一次对话就像一个十字路口,人工智能在路口中心扮演了一个交警式的角色,每当你输入一个命令,它只负责把你迅速引导到干这个事情的地方去。”李笛解释道。这也是人们熟悉的,当人工智能助手判定自己无法完成需求时,则通过调用搜索引擎展现结果的原因。

虽然Turn-oriented框架下的人工智能有着简单准确的优点,但这个发展了多年的框架早已触碰到了上升空间的天花板。Turn-oriented框架下的人工智能以单任务为导向,所以无法实现连续、自然的对话。无论如何,包括各厂商在亲和力和接受度相对更高的女性语音上下功夫,用户也始终脱离不了“在和机器打交道”的感觉。

微软解析全双工语音交互感官 微软小冰加速情商与智商整合

(微软(亚洲)互联网工程院副院长、微软小冰全球负责人李笛)

微软提出的面向对话全程的Session-oriented框架,则为对话式人工智能框架发展的上升空间提供了一个新的层次。李笛将Session-oriented框架下的人工智能对话比作河流,“从一个turn往下一个turn走,这个turn可能跟任务有关,但是这个任务之后可能会进入到进一步的交流。”在这个河流中甚至包括看上去可能“无用”的闲聊,但在“闲聊”中可能进一步引出新的任务,再随着新的任务引发一些知识的了解,然后走下去,对话将持续流转,更接近人与人之间的自然对话状态。而这也是采用Session-oriented框架的微软小冰与众不同之处。

微软解析全双工语音交互感官 微软小冰加速情商与智商整合

轻松的交流意味着更好的人机交互体验,需要让人工智能不再拘泥于眼前的任务,而是使用户把人工智能当作一个可以更好交流的伴侣。对此,兼具智商和情商对于人工智能来说就显得愈发重要。

对于此前一直向着情商方向发展的人工智能小冰,微软表示已经开始了情商与智商的加速整合。对于这种整合,微软表示“并不是有几个turn转向IQ,有几个turn转向EQ。我们把EQ作为一个最基本的基础,像一个土壤一样。能够展现IQ的,无论是任务还是知识,则像在这片土壤中种植的树一样的,是IQ。”李笛解释道。“EQ、IQ的整合工作,两边都在同时进行。包括微软小娜也在进行这方面的工作。过去4年里面小娜积累的IQ,现在放到小冰身上。”

微软解析全双工语音交互感官 微软小冰加速情商与智商整合

李笛最后谈到,EQ不代表情感,但EQ是影响对话的关键因素,是保持和加深关系的关键。如果没有EQ,就没有通用基础对话流程,保持对话也就无从谈起。

随意打赏

小冰语音微软小冰
提交建议
微信扫一扫,分享给好友吧。