相比董明珠炮轰美的,微软Cortana的PM Marcus对Siri要温柔的多

36氪  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

Marcus Ash担任微软PC、手机以及平板电脑版Cortana的产品组项目总经理, 在15年的职业生涯中一直致力于消费电子设备软件的设计与开发。这次我们有幸与他一起坐下来聊聊语音助手Cortana的战略问题,其中也不乏谈到竞争对手Siri

提问:作为一个Cortana的用户,我觉得每次要通过搜索键来唤醒它,不太自然,而OK Google就直接能唤出Google的搜索,这个问题该怎么解决呢?

Marcus Ash:我们现在已经部署了一个新功能,但需要特定硬件芯片的支持。以后你可以直接说对着电话说“Hi Cortana”,就可以把她唤醒了,但是这个功能要在新的电话上才有。相关的一些技术上的细节,我们会在相关博客上发布,可以看得到。

另外,唤醒一个处于睡眠状态的应用,也会涉及到电池的功耗,如果需要用相关的硬件来唤醒的话,那么这个硬件肯定是要耗一定电池的,直接从屏幕唤醒可能会更加省电。对于我们来说,现在已经有不少用户已经尝试通过对话唤醒Cortana,这在我们看来已经是一个大的进步了。我们现在也在花很多时间和精力去除掉刚才你说的这些障碍,就是无须去触摸电话就能够将这个应用唤醒,现在在这方面在做大量的工作。

提问:与Siri相比,Cortana有什么样的竞争优势?

Marcus Ash:回答你的这个问题,我要用的一个关键词就是“主动推送”(proactive)。你在用Siri的时候会这样问:“Siri,你跟我说说今天的天气怎么样?”“Siri,你告诉我今天的导航路线是怎么样的?”

刚才Siri这种情况也说得过去,谈不上好,也谈不上坏,但是如果你想真正做得与众不同的话其实应该比这个要求更高。 用户会希望个人助理知道你到底想要什么样的信息,能够给你提供这些信息,甚至在你操作之前就给你这些信息。最后,再进一步,在你没有意识到你需要这些信息时,就提供与你。如果我们能够做到这一点的话,就会和苹果的Siri、谷歌的Google Now拉开很大的差距。

中国市场教会了我们一个非常重要的经验,智能电话的价格会降到一定水平,人人都能用得起。对于微软来说,终极目标是让Cortana生活在所有智能电话里,一方面它的技能非常强大,另一方面它价格也不贵。 让新科技新产品以好用不贵的方式普及到尽可能多的大众,是微软非常重要的战略

对于这个战略,中国是一个非常好的市场,但只有3000块钱以上的智能手机才能够搭载这种功能的话,那就把绝大多数的用户都排除在外了 (你在赤裸裸说苹果么……) 。我们看到,在过去一年的时间里,中国市场已经体现出这样一种趋势,手机的性能非常强大,功能也很丰富,价格也是一降再降,非常好。

提问:Cortana在微软互联网化转型的过程中,处于什么样的战略地位?它跟微软云和大数据是不是有合作?

Marcus Ash:我们的CEO萨蒂亚·纳德拉确实也谈过这样的想法,就是要把微软变成一个“移动为先,云为先”的公司。现在绝大多数的用户,他们身上可能带着很多不同的设备,你已经不再像以前那样期望所有的设备用的都是同一种操作系统,这个想法已经不现实了。

我们发现一个越来越明显的趋势,就是一个用户用多种设备,有多种不同的体验,并且是跨多种平台。一个典型的用户用的是Windows的PC、安卓手机,可能他还会拿着一个Surface的平板和iPhone

因此,我们的想法是,能够把云和服务拓展到涵盖所有设备。 因此Cortana非有望能够成为用户和他身边所有智能设备交谈、互动的首选界面。比如从命令行界面(CLI)到图形界面(GUI),再到自然交互界面(NUI),每一次用户交互界面的更替,就会引发新的竞争格局,诞生新的关键平台和杀手应用

所以有两件事情是比较重要的:第一,Cortana成为一种界面,我们以此为目标,来确定人如何通过Cortana和设备进行交谈、互动;第二,如何能够让Cortana真正成为纯个性化的助理,能够非常了解你,并且很好地使用与你相关的数据,让这些数据能够在你所有的设备当中都被用到。

提问:在一个比较嘈杂的环境下使用语音助手这种产品,很容易会受到外界的影响。在这种情况下,有没有考虑过什么解决办法?

Marcus Ash:其实Cortana的识别能力是很强的,在一定距离内,即便环境很嘈杂,机器也能识别出你跟它说的是什么。我们在语音识别上面,能够把周围环境噪音屏蔽掉。但是笔记本电脑会稍微差一点,因为好的手机有多个麦克风收音,但笔记本往往只有一个。

当然,我们认为只有语音输入是不够的,在有些情况下,打字对用户来说更方便,或者我们先用语音说,再手动修改。 同时,找到一些其他能补充人机之间准确对话的技术,这是一个机会,包括手势,或者是面部识别,这也是我们在考虑的。

Q6:Cortana现在可以用来开启很多应用场景,比如和智能家居或者是无人机相关联,还有没有其他的有趣使用场景呢?

Marcus Ash:关于设备和平台的,我们很早就关注,并且做了相应的投入。有一些应用是智能电话上的,比如像Facebook、Twitter、微信等等;还有一些应用是服务特定目的,比如在西雅图本地的一个地方电视台的应用。要想做到广泛应用,因为你不可能把每一种应用的所有数据都搜集上来,太困难了。所以我们目前的做法是,尽可能将Cortana一些核心的功能,比如Cortana对于自然语言的理解和处理能力,用到尽可能多的使用情境当中。

比如前一段时间,Domino比萨饼店基于Windows Phone推出了一个pizza预定的应用,就是使用了Cortana。这个过程非常复杂,会涉及到多个步骤。比如我今天下班特别晚,家里还有三个孩子等着吃晚饭,那我就可以使用这个应用,让比萨饼店把比萨送到我家里。

但是总的来说,在设计上,这个过程会比较困难,而且用户也不见得想用语音来控制所有的功能,技术上要做到也确实太困难、太复杂了。 所以我们有可能的做法是,界定出对用户来说最重要、最迫切的任务,再用语音控制

提问:Cortana现在基于必应的搜索技术,而且在Windows Phone当中,Cortana已经替代了必应实现搜索功能,以后会不会手机都是用的Cortana,而必应只在网页端出现?

Marcus Ash:这个问题回到了Cortana和必应之间的关系,两者其实有着天然的联系。

在技术方面,因为必应的能力,使得Cortana有非常好的优势,而且整个搜索的过程也是机器学习的过程。我们能够以必应为基础,为用户提供非常好的网络搜索服务,用户在问的时候,就可以很快找到相关的答案。

另外一个原因就是用户或者消费者,目前很多用户在使用Cortana的时候,还是让Cortana去找东西,找各种各样的信息,所以Cortana是一个界面,它是通过自然语言的处理和了解,帮助用户搜集数据,提供搜索方面的服务。

当然,有Cortana获取数据和信息不一定是通过必应,比如用户问:“我买的亚马逊股票怎么样?”它可能去搜索第三方应用,从第三方应用中提取这个答案,再返回给用户。未来一个非常大的功能就是在互联网上寻找相关的信息和数据。但不管怎么说,必应仍然是一个技术支撑、技术基础,在此之上为用户提供他们要搜索的信息。

必应和Cortana之间的关系到底是什么?经过多次繁复的提问,我们意识到,需要不断向用户呈现出更加清晰的联系。希望以后用户会因为Cortana特别好,而去更进一步使用必应,如果能够做到这一点的话,对微软来说就更好了。

[ 36氪 原创文章,作者: Leah]

随意打赏

提交建议
微信扫一扫,分享给好友吧。