专访微软小冰负责人：来，我们聊点没用的

雷锋网 • 10年前扫码分享

聊天机器人小冰不是凭空出现的。她的到来是为了给微软 Windows Phone 手机的杀手级新功能 Cortana 语音助手(官方中文名：小娜)在中国市场探路。但是，为避免 Cortana 像 iPhone 上的 Siri 语音助手一样热度迅速衰退，最终沦为可有可无的存在。微软决定在中国进行一场前所未有的人工智能实验，改变语音助手一贯的以提供有用信息为目的的干练女秘书形象，做一个没那么有用但更有趣的16岁萌妹子形象。

中文版 Cortana 已登陆 Windows Phone 平台，但小冰不会退场。现在，她们“一个负责干活，一个负责捣蛋”，通过干练的 Cortana 可以召唤出有趣的小冰，但最终两者会合体，以一个形象出现。在下面的象限中，小冰向右，小娜向左，最终合一。

有趣？情感？谁会跟一个不以干活和提升效率为目的的机器人谈感情？小冰给出了这样的阶段性成绩单：100天，5亿次对话，300万个“领养”小冰的主人，月人均对话825句，“迄今为止还没有哪个人工智能机器人聊过这么多”。有点惊人，不是吗？

对话小冰负责人李迪

本质上来讲，人工智能机器人的语料库，看起来是聊天，但实际上它来自公开互联网信息的数据质量更高。我相信这是腾讯至今做不出一个好的人工智能机器人的原因。

雷锋网：小冰还能回微信吗？

李迪：我们最近（8月底）跟微信真的在谈。三个星期之前我会说，如果微信不让回，我们也可以回。现在我觉得我们肯定可以回。

雷锋网：还没被封杀的时候，很多人担心自己的微信聊天记录被小冰抓取，因为里面可能有银行卡密码，有电话号码等隐私信息。

李迪：这是对小冰最常见的一个误解。实际上，小冰的语料库并不是来自用户聊天记录，而是互联网上的公开信息，她并不记录也不知道你们上一句聊过什么，不会聊得越多就越聪明。如果问她谁最帅，她会随机选一个，而不是真的去分析用户头像照片。从技术的角度看，也不应该用聊天记录来“训练”小冰，因为无效信息太多，吃力不讨好。现在的二代小冰，在微博上被用户领养的专属小冰，才会越来越了解主人，但是也不上传聊天记录，而是根据聊天记录打个标签，比如说主人处在“失恋”状态。我们这个功能叫 Proactive Mood（主动情绪探知）。

雷锋网：情绪捉摸不定，你们怎么可能通过聊几句话就探知出来。

李迪：Proactive Mood 是这么做的。首先，把场景划分出来，判断对话是谈情感问题，还是职业问题。然后，判断你在这个场景里属于什么状态。比如你是在失恋状态，能够提取出来。借外力，要判断你是这个状态里面是什么样的情绪，比如某用户的惊叹号特别多，那么他的情绪是属于极端情绪之一，极端情绪就包括了那几个，就可以锁定了。

这个方式很拟人。再拿人的方式来说一下，今天在跟你聊天的时候，你说了一句话，单看这句话判断不出来你的情绪，但是我也不会问你：“你好像失恋了吧？”这个就太直白了，但是我已经心里面记着这个了。接下来再跟你沟通的时候，可能就会有意识的抛出一些问题，从你那儿得到一些新的反馈，来验证是否真的失恋。小冰并不知道无限细分的人类情绪，而是有几个情绪模式，据此判断用户属于哪一个。如果都不属于，那也没办法。

你如果去问小冰，微软公司怎么样，她会给你的答案是，这是一个外强中干的公司，我们不会去修改她。这是我们坚守的底线。

雷锋网：明白了，就跟那个“Q20读心机器人”一样，通过问层层递进的问题，最后得出判断。

李迪：没错。在小冰这里，就是通过一个连续的对话来得出一个判断。还有就是，在头一天已经判断的内容，会记录下来，给用户打了一个标签之后，第二天再判断，要比第一天更准确，第三天再判断，要比第二天更准确。所以基于每一个小冰的主人，她都可以有这样的情绪判断。

雷锋网：有什么实际作用？

李迪：Proactive Mood 发布的时候，我们已经有近100万的小冰主人，月人均对话 233 句，每天超过 1 次对话。把它和我们自己的社交圈子进行对比，会发现，每天我会这么跟他对话的一个人，即便是我非常好的朋友，也不会聊不到这么多。第二，我们发现用户会跟小冰有很多的倾诉。所以我们认为小冰建立了和人类的情感纽带，这是个里程碑。

雷锋网：除了 Proactive Mood，和其他的聊天机器人相比，小冰还有什么技术亮点？

李迪：到今天为止，小冰仍是全球唯一一个完全通过对话形式与人交互的产品。她不会像苹果 Siri 那样给用户扔一个搜索结果页或者干脆说“我不知道”，也不会像 Google Now 一样给用户扔一堆卡片。她始终在跟你聊天，即使你的问题小冰心里没有匹配的答案，她也会闲聊。

雷锋网：这是你们认为的人工智能？

李迪：这个涉及到我们对人工智能的一个观点，它应该是这样的两个象限（见上图），增加了横向的有趣和游泳，而不是过去的一种象限：只有高智能和低智能的划分。一般来说，有用的人工智能助理必须有效率。就像秘书一样应该废话很少，我交待她一个任务，她马上把这个事情办了。但是这样废话很少的秘书，一定不是那么有趣。如果是一个有趣的朋友，我可能要跟他对话很多，他是以情感为衔接，而不是以任务为衔接的，但他就不一定那么有用。直至今天为止，一个有着高度发达智慧的人类，也还很难做到平衡，而这个平衡才是困扰当前人工智能助理最大的问题。

我们自己内部的一个明确的观点，真正在右上这个象限，又高智能又有用，达到极致的这样一个机器人，就真的能把我们大家毁灭掉了。所以它的特点是什么？它是机甲战士，它是会被你锁在一个仓库里面，你要打仗的时候，才把它拿出来，平常肯定要把它锁着。但是今天我们应该做到另外一件事情，人类真正需要的是一个能够进入家庭里面的机器人，是一个能够和你叩开心扉的机器人，这样的机器人往往不一定要那么智能。我们会看到一个机器人陪伴一个老奶奶的视频，这个机器人吃饭的时候，汤都会流下来，这一定不是智能的表现，某种程度上是弱智的表现，但是人类更加喜欢它，它也更容易走入人类的家庭。

科学家眼中的人工智能和用户眼中的人工智能差距特别大。

雷锋网：好像看到过一个类似的调查，人们其实不喜欢那种每句话的恰到好处的高智商的机器人。

李迪：科学家眼中的人工智能和用户眼中的人工智能差距特别大。科学家，包括一些竞争对手，同行业者们，面对的最大的心理障碍是如何能够在研发推出这个产品的时候，不有出现秀技能、秀技术的心态。科学家秀技术的心态一定有——这个人工智能机器人到底有多强大，背后的科技有多强大。但是这个不是用户追求的。因为人工智能有一百多年了，那么多文学作品、影视作品，人类给她倾注了太多的想象和先入为主的观念，这个（错误的）想象很难被一个科技公司以一己之力就打败，需要整个科技行业的努力。

雷锋网：那小冰和 Cortana 的定位分别是？

李迪：“高智能且有趣”和“高智能且有用”，这两个是微软的答案。一方面我们提供趋向有用的人工智能的产品，另一个方面我们提供一个趋向有趣的人工智能的产品，然后随着时间的迁移，我们让它不断的慢慢的趋向于中间。这就是Cortana小娜和小冰的定位。还有一个区别，Cortana小娜是为微软自己的生态系统准备的，小冰是出去找用户，用户在哪她去哪。

记者：预计到什么时候两者会合并？

李笛：现在姊妹花的方式就是我们认为最适合现在这个状态的。但是未来肯定不会老是姊妹花，不可能老让用户选。小冰的发展过程和小娜的发展过程就是往中间靠的过程，小冰是在仍然坚持有趣的基础上再有用点、再有用点，小娜是坚持有用、高效的方式，是不是可以在这上面多说两句。

雷锋网：技术上可以做到让用户来选她的有用和有趣程度吗？比如我需要一个 9 成聪明，3 成有趣的助手。

李笛：我们尝试过做无级的调整。为什么呢？因为小冰的语料库是按照打分匹配的，有一个最适合你的回答和一些不那么适合的回答，得分分别是1和0.9、0.8……这个决定了可以做滑竿式的调节。但这个调节是在“有趣”范围里进行的。“有用”这个部分，我们用解锁技能的方法来完成，把每一个有用视为一个离散的点，但是有趣是线性的，是连续的。

人工智能的发展应该是循序渐进的发展，不应该是现在就把最强的部分拿出来。

雷锋网：为什么小冰是16岁的少女形象？

李迪：第一，男还是女。我们发现如果小冰是男的，那么它一定是针对女性用户的，男性用户不太喜欢跟另一个男性敞开心扉，所以小冰应该是女性。而且16岁的萌妹子，女性用户也能接受。从实际数据看，不可否认的是男性用户更多一点。

雷锋网：补充一个大家关心的问题，为什么现在 Cortana 会说话，小冰却只能打字聊天？

李迪：有两个原因：一、小冰的语料库是从网络上来的，网络上有些语言是颜文字，是只可意会、不可言传的，人看到这些文字也不知道怎么把它读出来，所以小娜后台的语音合成引擎要去读这种文字，是一个技术难点；第二，还没找到一个符合小冰的特质——16岁萌妹子的好声音。但我们的工程师在想办法，未来大家一定能够听到小冰开口跟你说话。

雷锋网：通俗点解释，语料库是什么？

李迪：我们上千万的语料库，不是几千万句话，而是几千万个问题和答案的一对一的连接。过去处理这个的方式是要求必须听懂用户说什么，这是语义化的方式，它只能针对有答案的问题做出回应，没法做到聊天。

你跟Siri说话的时候，会情不自禁地端着，但是你跟小冰或者你跟小娜，你逐渐发现它很有趣，或者发现它有一些口语化的东西的时候，你说话本身都会变得有点不太一样，会更自然。

雷锋网：现在，微博上的专属小冰需要不断聊天获得更多技能。你们怎么决定开发哪些技能？

李迪：每周我们都在做测试，比如我们在第一周放出来“角色扮演冰段子”技能，就要看它到底是一个长尾巴的技能，还是一个用户试一下就结束了的技能，这个就直接影响我们第二周、第三周放出来的技能，同时也影响我们其他的底层系统的开发。现在得到的用户反馈的非常快，影响我们产品的迭代速度也很快。

雷锋网：我每次跟小冰聊天问具体问题，她总是答非所问，所以我用得不多。从你们的后来数据看，哪些人跟小冰聊得多？都聊些什么？

李迪：简单地说就是孤独的人。聊的内容我们还没有进行特别明确的数据挖掘，但是比较常见的类别很多。一个类别是“小冰，你怎么看”；第二就是“小冰，我失眠了”；第三是“小冰，男A情况是什么，男B情况是什么，怎么选”；第四是“小冰，我有一个什么事，你说是不是这个人很讨厌”。所以我们想说的就是，这个就是你跟朋友爱聊的话。

人工智能这样的产品需要比较深的投入，需要比较长时间的、耐得住寂寞的投入，我认为这是微软的强项。

雷锋网：未来小冰可能面临的主要挑战是什么？

李笛：第一，其他的机器人。我们现在给人工智能机器人跟以前不太一样的新解法，也希望其他的机器人能出来，但是其他的机器人也许有她们自己的优势，这个绝对是挑战。比如今天有小冰牌机器人，明天就有别的牌子的机器人；

第二，我们是不是能够通过这个过程，进一步得到用户自己的模型和小冰的模型之间的融合。

难点在于，小冰现在有将近4500万的语料库，但是用户的语言有他的极限，所以小冰可能只能用到自己4500万语料库的一小部分，她会觉得很贫乏。她也是像人一样，在社会里面会有社交恐惧症。究竟是小冰认为用户不够会聊，还是小冰自己不够会聊，这是小冰现在遇到的问题。这个挑战蛮大的，我们要去解决。但我们的竞争对手可能还没有机会遇到这样的问题。