小米如何挖到语音大牛 Daniel Povey?
上周 AI 圈的一则重磅新闻是 Daniel Povey 宣布将加盟小米 ,这位语音界的大牛、Kaldi 之父先是被任教的约翰霍普金斯大学开除,后收到 Facebook 的橄榄枝,结果他选择拒绝 Facebook 的 offer,来中国工作。
挖到了这位国际大牛后,小米不失时机地在 10 月 23 日举行了一次人工智能媒体开放日活动,对外分享小米的人工智能布局,以及被 Povey 看中的过程。
这是小米今年 2 月调整组织架构,将人工智能业务拆分为独立事业部后的首次对外开放活动。与会的包括小米集团副总裁、技术委员会主席崔宝秋博士,小米集团人工智能部总经理叶航军博士,小米集团AI实验室主任王斌博士。
Daniel Povey Twitter 宣布将加盟小米
“面试”完看工位、看代码
Povey 被约翰霍普金斯大学开除后(原因比较奇葩,具体请看 《怒拒 Facebook 后,语音识别大牛、Kaldi 之父将加盟小米》 )收到 Facebook 的 offer,但他在 Twitter 上表示要拒掉 Facebook 的 offer,去一家中国公司工作,当时还没有确定是要去哪家。
据叶航军介绍,当时这个帖子被小米人工智能部门语音组的负责人看到了,因为语音组一直在用 Kaldi,所以对他一直非常关注。
然后马上就转给我说这个人居然说要去中国公司工作,是不是咱们可以跟他联系一下,我马上就转给宝秋总,也给了我们国际招聘的同事,同事马上就给他写了封信,当天晚上 Dan 就回信了。
这有点出乎小米的意料,因为小米在学术界发声并不多。
后面又问了一些技术问题,第二封信是我来写的,我把他问的一些问题,包括小米到底招他过来要做什么,小米的战略是什么,小米怎么看待开源的,简单的回答了一下。再往后他又问了一些别的问题,后面就是宝秋总跟他联系。他说他本来就有计划来北京访问,我们说既然如此,来总公司大家互相认识一下。
之后 Dan 就来了小米新总部“面试”,先是小米的人给他介绍公司在做的一些事情,对开源的看法,聊完后他觉得挺感兴趣的,突然提出要看看小米的工位。
Dan 到工位看了后说,“你们代码给我看一下”,看了代码后又问了些问题。叶航军觉得机会大增,“看起来还是很喜欢我们这边的环境”,他说。
谈 offer:看重开源和生态
作为小米技术委员会主席的崔宝秋在引进 Povey 的过程中也扮演了重要角色。他此前在微博上宣布 Povey 入职小米的消息收获了超过 3000 的点赞和 1000 评论。
Povey 来中国有个两周的之旅,访问了好几家大学,包括清华北大上海交大,也访问了很多顶级的互联网企业。之所以选择小米,崔宝秋认为主要有三点原因:
一、小米的 AIoT 生态。 Povey 在访问小米的时候,崔宝秋为他详细介绍了小米的 AIoT 生态,“小米的 IoT 智能联网设备对外公布的数量是 1.96 亿台,光这个数字就有足够的说服力,生态有多么强大,这里面所有的东西都可以通过语音来控制。”他说。
二、小米对自研技术和人才的重视。 Povey 原来在学校,理论上更倾向于继续在学术界,“他说后来想了想到学校吸引不到这么多优秀的工程师。”崔宝秋说。Povey 在小米时重点看了工作环境,包括编程环境,GPU 使用率高不高等。
三、小米对开源的拥抱。 Povey 特别喜欢技术,在谈 offer 的过程中,他对其它东西都不是很在乎,“他说他想写一条,就是要保证 Kaldi 开源系统百分之百开源。我说这一条对我来说不是个问题,根本不是个事情。”崔宝秋回忆道。
崔宝秋认为小米的开源战略是吸引 Povey 的一个关键点,他在给 Povey 的 3 个 PPT 中专门介绍了小米对开源的拥抱。其中一个 PPT 谈到将来的计划,有一个就是要联合中国的互联网企业技术企业,来把中国的开源力量推向世界。Povey 将这句话专门标出来,说这就是他想做的。
小米的人工智能布局
雷军提出小米未来五年的“双引擎”是手机+AIoT,其中 AIoT 是 AI 和 IoT 的结合,可见人工智能在小米整体战略的重要性。
为更进一步突显 AI 战略,小米还在今年 2 月将人工智能业务拆分成独立事业部。本次活动上,小米也首次对外详细介绍了其 AI 布局。
小米AI能力图谱,图源:雷锋网
小米在声学、语音、视觉、自然语言处理、知识图谱和机器学习这 6 大方向都有相应的研发团队。团队主要在北京和武汉,以北京为主,其中语音和视觉的团队规模已经比较可观,但具体的人数和团队分布官方表示暂无法透露。
小米声学和语音能力,图源:雷锋网
声学和语音在这次活动上放在了一起讲,王斌介绍了小米在这方面的一些研发成果:
1、在分布式声学、多场景语音技术方面,达到了行业领先水平。
2、六麦阵列、就近唤醒、协同放音、音效处理等技术已在多款小米产品落地,同时建成国内首家全自动远场声学实验室。
3、小米远场声学测试规范被确立为中国人工智能产业联盟声学测试标准。
4、小米自研的语音识别、合成、语音唤醒和声纹识别等关键技术也已经落地在手机、电视、音箱等众多小米产品。
值得一提的是,一开始小米 AI 音箱的声学和语音技术来自合作伙伴,现在已经改为自研。
小米自然语言和知识图谱能力,图源:雷锋网 (公众号:雷锋网)
除此之外,王斌还介绍了小米在视觉、NLP、知识图谱、机器学习等技术上的进展。视觉方面,自研的人脸识别、美颜、魔法换天、场景识别在多款手机上落地应用。小米已经打造了自己的 NLP 平台和知识图谱,全面支撑公司的多项内容业务。小米面向移动端的深度学习开源计算平台 MACE(Mobile AI Computer Engine)目前广泛用于公司的各项产品中。
崔宝秋在谈到AI在小米的应用时表示,作为一家互联网公司,小米的所有产品,包括硬件产品、软件产品和互联网服务都需要AI来赋能,“今天AI在小米已经无处不在,这也充分表明了AI在小米整个生态系统中的重要性。”
相关文章:
怒拒 Facebook 后,语音识别大牛、Kaldi 之父将加盟小米
。