小米人工智能与云平台副总裁崔宝秋:智能手机 + IoT 为 AI 打造无限生态
雷锋网按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,由雷锋网 (公众号:雷锋网) 、香港中文大学(深圳)承办,得到了深圳市宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。
7 月 1 日,随着议程进入到第三天,本次 CCF-GAIR 大会也在上午迎来了 IoT 专场。在本专场中,小米首席架构师、小米人工智能与云平台副总裁崔宝秋博士登台,做了题为《小米 AI 与 IoT》的主题演讲。
崔博士在美国纽约州立大学石溪分校计算机科学系拿到博士学位,曾任 LinkedIn 主任工程师和团队负责人,也曾在雅虎搜索技术(YST)核心团队主任工程师;2012 年 6 月加入小米后,崔博士创立并管理了小米云计算、小米云存储、小爱同学、AI 平台、AI 实验室、大数据、搜索与推荐等团队。
在演讲中,崔博士主要介绍了小米在 AI 和 IoT 方面的进展。他首先强调,小米不仅是一家智能手机公司,更是一家以手机、智能硬件和 IoT 平台为核心的互联网公司;同时小米也是一家大数据公司和 AI 公司。就 AI 而言,崔博士表示小米在 AI 上有三大优势,包括产品硬件优势、大数据优势和小米生态链的广深布局。
就小米的 IoT 平台而言,崔博士谈到了三点:
-
一是小米把很多传统的家电设备变成智能设备,其中,小米从 2014 年到 2018 年相继推出了包括 Wi-Fi 模组在内的一系列模组;
-
二是用户控制智能设备,比如说所有的小米品牌的智能设备和米家品牌的智能设备都可以通过米家 App 来控制,当然这个生态是开放的;
-
三是自动化场景,不仅让用户可以主动控制,也可以根据环境(包括温度、湿度、灯光)、人的移动、还有其他各种条件(闹钟、天气)等等,自动控制这些智能设备。
崔博士表示,IoT 平台在内部叫做 MIoT 平台,这个平台已成为全球最大消费类 IoT 平台,目前全球接入的激活设备数超过 1 亿台。截止至 2017 年 11 月,IoT 智能设备超过 800 多种,日活跃设备数超过一千万,已连接家庭超过两千万家庭;每天的请求数超过 400 亿。
在这样的布局之下,小米 IoT 与 AI 的关系更加密切。崔博士强调,小米的 AI 战略就是围绕小米的核心业务打造小米强大的 AI 技术,落地智能产品;这是一个层层推进的过程:从底层的大数据、云计算、深度学习,到上一层的感知、认知能力,再到应用层,如搜索与推荐、小爱同学,再往上走,正是为了打造小米的 IoT 生态。广义上讲,智能手机也是属于 IoT。
演讲临近结尾,崔博士谈到了小米在 AI 上的进展,比如说 AI 为小米手机上的拍照表现带来了巨大的提升,而小米 AI 音箱也在推出之后一片火热,广受欢迎。崔博士还谈到了小米在 2018 年 6 月 28 日发布的 AI 开源项目——移动端深度学习框架 MACE(Mobile AI Compute Engine)。
对此,崔博士在接受雷锋网采访时表示,小米之所以推出开源的 MACE 移动端深度学习框架,有两方面的原因:
-
一是因为小米内部也在倡导开源、拥抱开源,而开源也是小米工程文化的一个重要组成部分。而且小米也是一个创业公司,许多方面的发展也是享受了开源带来的便利,可以说是站在巨人的肩膀上,因此 MACE 也是对开源社区的一种回馈。这整体上反映了小米开放、开源、共享的态度,小米也希望通过 MACE 来赋能中国的 AI 生态和 AI 产业。
-
二是在解决智能手机等移动端相关问题的过程中,小米发现当前已经存在的同类产品(比如说 TensorFlow、TensorFlow Lite、Caffe)在端上的 AI 推理等能力等无法满足需求,无论是对内存、性能的要求还是对 GPU、CPU 和 DSP 的支持方面。
最后,崔博士表示,智能手机是人工智能的最大平台,“智能手机 + IoT ”为人工智能打造无限生态,这就是小米的优势。
以下是崔宝秋博士在 CCF-GAIR 大会上的演讲内容,雷锋网对其进行了不改变原意的编辑整理:
各位嘉宾、各位朋友,大家上午好!我是崔宝秋,在负责小米人工智能与云平台,今天是第三次参加这个大会,很高兴有这次机会和大家分享小米在 AI 和 IoT 上的进展。
刚才赵总(注:海尔家电产业集团副总裁赵峰)讲了非常多,我和他认识很多年,有很多共同语言,做的事情也有相似性。小米和海尔做得有一点不同,小米做得更广一些,海尔做的是全屋智能,小米做的是无处不在、无所不能的智能。
人们对小米的认识很多还停留在小米是智能手机公司。小米不仅是一家智能手机公司,更是一家以手机、智能硬件和 IoT 平台为核心的互联网公司。6 年多前我加入小米,不是因为小米是一家智能手机公司,而是因为雷总说小米是一家移动互联网公司。作为技术人员,我更愿意讲小米是一家大数据公司,也是一家 AI 公司。赵总刚才讲了很多大数据,这是我和赵总有共同语言的地方,大数据、云平台的重要性。今天我主要分享小米在 IoT、AI 上做了哪些事情。
小米在 AI 上投入再多都不为过。小米是一家AI公司,AI 在小米无处不在。为什么我这样说?大家从这张图可以看出一些端倪,小米不仅是智能手机公司、也是智能设备公司。这里面列了小米和小米生态链企业做的 IoT 设备、AI 设备,大家可以看到小米丰富的产品线,小米在很多产品、智能场景上都需要 AI 技术,也可以看到各种技术在这里面都需要,甚至无人驾驶技术在扫地机器人里面也会用到。
这张图也给大家一些提示,小米做 AI 的优势。很早以前我们总结出小米在 AI 上的三大优势:
-
一是硬件产品优势,我们可以做一款精美手机,做一系列非常漂亮、用户耳熟能详、喜闻乐见的一款款小米、小米生态链产品,证明小米在硬件产品上的优势。这方面我们在世界上也是比较领先的。我们很多产品可以轻松的成为爆品,卖到千万级的销量。
-
二是大数据的优势。小米是大数据公司,而且必须是一家大数据公司。最近我曾说我是小米数据驱动的驱动者,AI 时代来临以后,大家越来越肯定我之前在大数据上做的努力。小米有全生态、多样性的大数据,这点和其他互联网公司都不太相同,其他互联网公司对用户的了解是某个侧面或者多个侧面,我们对用户的了解是全方位的。我们的用户画像可以用全息高分辨率的照片来形容。
-
三是小米生态链的广深布局,我们在公司内部曾经讲是“竹林模式”。是野蛮生长、快速蔓延的模式,里面每棵竹子代表一家企业,每棵竹笋可以想象为一款产品。在我们打造生态链的前一两年,我还可以数出来哪些公司做了哪些产品,但是一两年之后我已经无法记录。
小米的 IoT 战略,4、5 年前我们开始布局 IoT,当时比较朴素的想法是把小米模式从智能手机复制到其他领域、其他行业。像前几年我们布局国际市场,把中国的小米模式 COPY 到国际市场。IoT 战略最早是想把比较领先的小米模式从手机复制到 IoT,后来我们形成了代表生态链团队的战略,以手机和智能音箱为中心连接智能设备。
我来小米最早打造的是小米的云平台,生态链团队打造的是 IoT 的接入平台。早年我们把智能设备定义为互联互通+简单智能,这样就称之为智能设备。强调与云端的互联、与手机的互联;今天这个概念已升级。早期的智能不是真正的智能,未来的智能才是真正的智能。
关于小米的 IoT 平台,我们看几个方面。
-
第一,把很多传统的家电设备变成智能设备。第一个做的是小米 Wi-Fi 模组,其他厂家把这个芯片卖得很贵,小米用自己的模式把它做到 20 多元人民币。2014 年到 2018 年,从原来简单的Wi-Fi模组到蓝牙、双模到支持 NB-IoT 和蓝牙 Mesh 模组。十几元的东西就把传统的家电设备变成智能设备。IoT 接入平台支持多种操作系统,还有标准的协议。这让小米 IoT 生态变得更加开放、更加标准化、更容易接入。
-
第二,用户控制智能设备。这是早期、现在我们还在使用的控制平台。用户如何控制智能设备?我们做的很大优势是:所有的小米品牌的智能设备和米家品牌的智能设备,米家就是生态链企业为我们打造的产品,即竹林里面的竹笋。所有的产品通过米家 APP 来控制,这是跨平台的,iOS 和 Android 都可以。今天可以用小爱同学控制,也有很多可以通过小米电视控制,也可以通过小程序、SDK 控制,这个生态是开放的。刚才赵总也讲了一个生态必须是开放的,我们支持其他的系统来接入控制。
-
第三,自动化场景,不仅让用户可以控制,可以根据环境,包括温度、湿度、灯光、人的移动,还有其他各种条件,闹钟、天气等等,自动控制这些智能设备、智能套餐。这是我想象中未来的智能生活的初级阶段。
IoT 平台在内部叫做 MIoT 平台,这个平台已成为全球最大消费类 IoT 平台,目前全球接入的激活设备数超过 1 亿台。不经意间这些设备已经遍布全球。小米需要服务全球 70 亿人口,很多国家都非常需要小米,可能比中国还需要小米。截止至去年 11 月,IoT 智能设备超过 800 多种,日活跃设备数超过一千万,已连接家庭超过两千万家庭。设想小米是多么被需要。每天的请求数超过400亿。自动化的场景每天执行 2000 多万人,给用户带来很多智能美好生活。
什么叫智能生活?在我心目中的智能生活是智能无处不在的生活,从智能手机到智能穿戴到智能车载一系列智能音箱控制的智能家居产品,这是我说的和赵总不同的地方。
刚才讲 IoT 的布局、打法和进展,AI 上我们做了哪些呢?6 年前我开始主推云计算、大数据、数据驱动,2016 年开始大力投入 AI。我一再强调,不是因为 AlphaGo 才注重 AI,其实 AI 和机器学习技术在小米早已被用到,从搜索到推荐、内容分发、广告、互联网金融、电商、新零售等,AI 在小米用得很深,2016 年把 AI 作为小米的核心战略,加大投入,我们的 AI 战略是什么?就是围绕小米的核心业务打造小米强大的 AI 技术,落地智能产品。
AI 火的时候大家都谈 A、B、C:AI(人工智能)、BigData(大数据)和 Cloud(云计算)。小米走的路从 C 和 B 同时到 A。B 因为数据科学家,6 年前在中国还是比较稀缺,花了一年时间才打造大数据团队、打造小米的数据科学家团队,事实上比 C 晚一些。当时我是 C 和 B 同时推的。A 不用讲,今天大家都在拥抱 AI,AI First,All in AI、AI in All,各种说法都有,我在公司强调“AI 无处不在”。这是我们团队积累的一些技术栈。从底层的大数据、云计算、深度学习,就刚才讲的 A、B、C 技术能力到上面的感知、认知能力,到应用层,如搜索与推荐、小爱同学,再往上为了打造小米的 IoT 生态,广义上讲,手机也是属于 IoT,为了打造小米的“智能手机 + IoT ”生态必须打造一个平台。我们五年前推出小米的开放平台,今天小米的 AI 开放平台是小米开放平台的重要组成部分。有了这些能力和平台,才能更好地支持小米内部的所有业务,以及外部的小米生态链及其他业务。
在技术上,小米是开放的,也是大力投入的。我加入小米不久就制定了小米的开源战略,在 2018 年 6 月 28 日第十三届开源中国开源世界大会上,我们正式发布小米在 AI 上的开源项目—自研的移动端深度学习框架 MACE(Mobile AI Compute Engine)。云服务、云平台的 AI 能力是一方面,但是 AI 需要云和端上的能力同时并进、相辅相成。在端上,我们非常注重,MACE 就是要帮助端上的智能。在手机上、各种智能设备上,很多智能的决策是不可能推送到云端来做的。有的场景你不可能等几十毫秒来回,到云端再回来,一个来回就把时间浪费了。开辆车,前面突然有一只小狗跑过来,你需要在零点几或者一两毫秒做出反应,怎么可能送到云端再拿回来?大量的数据,车载场景或者任何场景,很多数据是 GB 级或者 TB 级,不可能送到云端再送回来。小米为了在手机上做各种智能推出开源的技术,希望通过 MACE 来赋能中国的 AI 生态、AI 产业。
小米在 AI 上做的工作,今天我蜻蜓点水简单讲几点。过去一年多我们专注于两个方向,视觉和语音交互。视觉更关注手机上的相机、手机上的美颜等功能。为了把手机上的相机做得更好,我们做了智能场景优化,可以指导什么场景拍什么风景。我喜欢照相,不同的场景拍人、动物、风景、建筑、海边、森林是需要不同的曝光参数,这对专业摄影人才或者爱好者是比较容易,对小白用户比较难,AI 可以自动帮你搞定,AI 相机帮助每个人成为摄影达人。
AI 在美颜上可以做什么?这些视觉能力今天可以用在手机上,明天就会被用在各种 IoT 上。人脸识别、图像理解,在各种监控摄像头、家庭摄像头里面会用上,我们在美颜上做了哪些工作呢?一个工作就是单摄背景虚化,我们秒杀 iPhone X,这样看不出来,左边是红米单摄背景虚化,用 AI 做大片感。右边是 iPhone X。左边的头发丝清晰可见,右边全部糊了,这都是深度学习通过大量的人像数据来做的。再看衣服领上毛茸茸的地方,也明显可以看出差别。这是我们视觉上做的东西。
我今天主要想讲的是 AI 音箱,语音交互,在语音上做了哪些东西。我们和谢磊老师的团队合作,在语音识别上做了很多工作。我认为今天语音交互时代真正到来了,主要是因为语音识别准确率提高了,更深层的原因是因为深度学习技术,后面大量的语料,再往后是因为云计算能力、弹性计算能力,还有 GPU 这类的 AI 芯片。我们打造第一款 AI 战略级产品就是小米 AI 音箱,2016 年 9、10 月份开始立项,2017 年 7 月份开始发布,发布以后非常火,到今天还供不应求。3 月份因为用户的需求量大增,很多用户不满足于大的音箱放在客厅,还希望很多音箱放在卧室、厨房,甚至卫生间。我们为了满足这些用户的需求推出了小爱音箱 mini 版,也非常火。3 月份随着 MIX 2S 旗舰手机的发布,我们把小爱同学移植到手机上。我们在内部推的是把复杂操作变成一句话的事,可以做得很靠谱。手机上可以做各种各样的能力,小爱同学将把这些能力赋能所有的 IoT 设备。
比如,对小爱同学说:“帮我订明天从北京到深圳的火车票”,小爱同学就可以自动帮你订。小爱同学背后是智联万物的AI虚拟助理。这个定义里面,每个词都有它的必要性,智联万物,智联小米的 IoT,AI 虚拟助手,等会儿我会讲虚拟代表什么。小爱同学去年发布以来,小爱同学的月活快速增长到两千二百万,远超我的预期。贵阳大数据产业博览会上小爱同学拿到“2018 领先科技成果奖·黑科技与新产品”双料大奖,非常不容易。它的能力和用户接受度被行业充分认可。小爱同学不仅是语音交互平台,后面代表的是个很大的生态。
昨天小米之夜的专场我和大家也有分享,今天大家理解的小爱同学还是我心目中狭义的小爱同学,广义的小爱同学将来无处不在、无所不能、与时俱进、如影随形,左边接各种智能设备、右边接各种内容与服务,包括各种技能。今天小爱同学可以控制来自小米和米家十几大类硬件产品,这个数目不断增加。小爱同学支持的领域包括知识、服务、内容、控制、娱乐等等、等等,支持的内容也在不停的蔓延。今天已经有两百多种非常实用的技能,老人、小孩、男男女女、大家都喜欢,总有一款适合你,总有 N 款被你喜欢。小爱生态已经开始快速生长,超出我的预期。这是非常可喜的增长。
为什么小米做这些东西一下子能非常火?其中主要的原因就是技术的投入和大数据优势。我们语音团队在 2017 年 2 月份成立,到 2017 年 11 月份,我们电视场景下的语音识别字准确率达到 98.53%,是非常惊人的。这也说明小米在大数据上的领先性,也是今天整个中国在 AI 上可能领先的一大优势,我们有众多的产品,有全生态多样性的数据,中国有人口、场景和消费能力。在手机上也可以达到 97% 的字准确率。未来 IoT 想象空间无限,未来自然交互空间,比如今天是语音,明天是视觉,到后天可能就不需要交互,自然就为你服务。
知识图谱也是我们大力投入的一个领域,小爱同学知识图谱不断更新,我们计划每月翻番更新。小米的 AI 将无处不在、无所不能、与日俱增、如影随形,与日俱增;包括知识,通用知识、专用知识,服务的主人了解程度。如影随形是为主人量身定制,像影子一样,这是小米 AI 和 IoT 的未来。
智能手机是人工智能的最大平台,“智能手机 + IoT”为人工智能打造无限生态,这就是我们小米的优势。有了 AI,我非常有信心,小米有可能更早、更好地实现小米新的使命:“始终坚持做‘感动人心、价格厚道’的好产品,让全球每个人都能享受科技带来的美好生活。”这里的科技我想 80%、90% 都是 AI 科技。
谢谢大家!
。