Mosaic 刘宿莽:从 Alexa 平台上的 Skill 到车载语音助手
“语音一定是未来,我非常确认。” Mosaic 联合创始人刘宿莽说这话时没有半点犹豫。当时,他正在硅谷办公室中与雷锋网新智驾畅聊他的创业故事。
Mosaic 是一家语音助手创业公司。如果一定要类比,这家公司与国内已经上市的科大讯飞、,同为创业公司的出门问问、思必驰、云知声和蓦然认知等从事着非常相似的业务。
刘宿莽并不否认这些竞争对手存在的事实,不过他也表示,“我们真正关注人们在出行过程中所需要的语音交互。”所以更为精准的描述是,Mosaic 做的是“基于地理位置(Location Based)的语音助手”,这也是他所认为的 Mosaic 的最大特色所在。
具体而言,Mosaic 将人们出行过程中的位置信息作为一种语境(Contextual),而语境则是自然语言理解(NLU)中很重要的一部分。语音助手需要明白在什么样的状况下该说什么样的话,在什么样的场域(Domain)里该执行什么样的操作。
既然是面向出行领域,那么汽车行业便顺势成为了 Mosaic 最重要的一块市场。今年上半年,刘宿莽拿到了国内某著名车企在硅谷的风投机构的投资,同时也开始了与一些国内外车企展开接触与合作,准备将其语音交互技术落地到他们的下一代车型中去。刘宿莽透露,Mosaic 目前对电动车型非常感兴趣,已经有两家电动汽车领军企业与其成为深度合作伙伴。
实际上,Mosaic 走上开发车载语音助手的道路,并非一蹴而就的。
始于 Alexa 上的一个 Skill
刘宿莽本身是做地图出身,本科在武汉大学,学的是地理信息科学,毕业时还拿到了地理信息界的著名奖项“王之卓奖”。2010 年赴美进入田纳西大学读硕士,学的依然是地理信息科学,两年后正式毕业。2012 年 12 月,他加入苹果公司,在苹果的 Geo Team 担任数据科学家,帮助建立了苹果地图的后端数据处理流程以及数据质量标准体系。
从这一系列的经历来看,也难怪他在描述 Mosaic 的最大特色时,特别强调的是“Location Based”。
时间来到 2015 年,刘宿莽当时还在苹果地图工作,一次偶然的机会,他在硅谷参加了朋友组织的有真格基金创始人徐小平出席的交流活动。活动结束之后,很多想创业的年轻人团团围住徐小平,表达自己的诉求,当时刘宿莽就站在边上看。那晚,等人都走得差不多了,徐小平开始逐个询问留下来的为数不多的几个年轻人,了解他们是做什么的以及想做什么。问到刘宿莽时,因为他原本就没什么诉求,便回答徐小平:“我还没想好,就不跟你说了。”这勾起了徐小平的好奇,也让他记住了刘宿莽这个年轻人。
后来,在另一个酒会,刘宿莽又见到了徐小平,徐小平当时主动向刘宿莽问起,“现在想好(要做什么)了吗?”刘宿莽答,“我想了一些东西,我们聊聊吧。”
具体聊了些什么,刘宿莽并未向雷锋网新智驾透露太多,但聊完之后的结果是,徐小平决定投钱给他。刘宿莽坦承,那个时候他自己的想法也不完全明确,更没有想到要聚焦到语音助手这个领域中。“他只是觉得我们比较有意思,而且背景还不错,就投了我们钱。”
拿着徐小平几十万美元的天使投资,刘宿莽与他的合伙人开始摸索创业方向。
那之前的 2014 年,亚马逊 Echo 智能音箱横空出世,智能语音助手开始成规模地走向普通家庭。整个 2015 年,Echo 的出货量达到 250 万台,成为现象级的智能硬件,也正是在这一年,在合伙人的强烈推荐下,刘宿莽开始深入体验 Echo 智能音箱,并且广泛收集和分析网络上针对 Echo 的评论。经过长时间的体验和调研后,那一年的 7、8 月份,他们终于得出结论,认为 Echo 虽然没有 iPhone 那样惊艳,但具备 iPad 诞生时那样的影响力。Echo 从真正的需求层面解决了一些问题,“我自己也感受到了(它的)好处。”刘宿莽说。
这样的认知给了他和他的合伙人初步的创业方向。
那以后,他们开始在 Echo 音箱的语音服务平台 Alexa 上开发应用技能(Skills)。Mosaic 作为他们的第一个 Skill 作品,迅速在 Alexa 平台上俘获诸多用户的心,这个 Skill 的精髓在于,允许用户使用一个语音指令控制多个动作,形成某种连串反应。
Mosaic 作为 Alexa 平台上的一个 Skill 大获成功之后,2016 年,作为一个创业团队和一家创业公司的 Mosaic 也接到了全球知名孵化器 Y Combinator 伸出的橄榄枝。进入 YC 之后,Mosaic 面对的现实环境是,Alexa 平台上的开发者越来越多,各种各样的 Skill 也都蜂拥而上,这就导致开发者本身的价值大打折扣,同时金钱的回报方面也得不到任何保障,因为“任何好的东西可能最终都会被变成 Alexa 的一部分”,而这并不是长久之计。
刘宿莽和团队在 YC 给出的建议的基础上,开始进行各种各样的尝试,最终,他们选择了语音助手这条道路,因为那时候 Mosaic 团队已经拥有了一套在自然语言理解(NLU)方面较为成熟的技术。
当然,如果只是做语音助手,很难将其做成大生意,还需要行业的助力。正在发生巨变的汽车行业成为他们看到的大机会,新的语音技术,加上足够大的汽车行业平台,刘宿莽期待的独角兽最有可能诞生。
车载语音助手:从硅谷到中国
从确定做车载语音助手,到拿下国内车企方面的投资,Mosaic 与车企的结合速度,正在不断加快。刘宿莽表示,他们与车企的合作,车机将是非常重要的合作形态。想得更远一些,汽车一级供应商也是他们非常好的合作对象,而这要等到与车厂的合作慢慢成熟之后。
遗憾的是,雷锋网新智驾目前还没有看到任何 Mosaic 的实车测试 Demo。刘宿莽解释称,保持低调的风格是因为他们希望对外保留自己的技术实力,之后针对具体的信息会作统一的发布。
虽然 Mosaic 起源于硅谷,但是其视野绝对不限于硅谷。面对中国这一全球第一大汽车市场,Mosaic 的进入在刘宿莽看来是“必然选择”。从情怀层面,他是中国人,将企业带向中国市场无可厚非;而且,Mosaic 还和很多国内车企建立了合作关系。
(预告一下:2018 年 1 月 16 日,雷锋网 (公众号:雷锋网) 将在美国科技大本营硅谷举办 GAIR 硅谷智能驾驶峰会,将有近百家自动驾驶产业链公司在现场交流。详情请访问 https://gair.leiphone.com/gair/gairsv2018 。)
那么,这也意味着 Mosaic 将面对的是如林般的竞争对手。
不过,在刘宿莽看来,“(国内的竞争对手们)都处于一个状况,就是在技术层面进行 PK,这不是我们最关注的点,我们关注的是用户想用(语音助手)干什么。”这个问题当然很难,还没有企业能解决得很好,刘宿莽目前也没法透露 Mosaic 是如何去做的,但他强调,“并不是说技术不重要,而是某一些技术,其实在某一个时间点上是更重要的,我们比较关注这类技术。”
如前文所述,Location Based 是 Mosaic 语音助手最大的特色,那么与位置信息有关的技术将会成为其核心能力。而在这一能力的实现上,目前,Mosaic 与很多地图厂商展开了合作。
当然,要谈更远的未来,现在还不是最好的时机。
现阶段,Mosaic 拥有 10 多人的团队,多数具备苹果、谷歌、Facebook 的大公司背景,内部实行“一带一”的人才发展模式,有多年工作经验的员工带经验欠缺的 PhD,团队还在扩张。而在资金方面,刘宿莽透露,整个天使轮,Mosaic 总共拿到了数百万美金的投资,而这些资金目前足够支撑公司的运作。
。