专访小米公司联合创始人、小米电视负责人王川
现在人工智能这个团队大概有多少人?
王川:现在是由小米大脑团队负责,具体多少人,因为不在我这里,不方便讲,主要是我们跟小米大脑团队配合。
在这个产品当中,你们这边是不负责研发的吗?
王川:我们研发是两边共同去研发的,后端的算法是他们提供的,我们在前端把技术怎么产品化,怎么用到电视里,怎么解决消费者的痛点。
能具体介绍一下吗?
王川:比如我们昨天看到的对一个语言的理解,要把这个语言理解成意图,是他们这个团队要去做的。包括我们昨天看到的在图象里去识别人物,识别地点,这些算法是由小米大脑提供的,我们这边是提出我们需要这样的技术,怎么用这些技术,我们这边开发电视端的软件,跟他云端的能力去配合。
还有一个问题,我们的语音是跟搜狗合作的,选择搜狗的原因是什么呢?
王川:选择搜狗的原因,我跟王小川是好朋友,他是最早认识到深度学习是今天的技术突变,这个技术突变我觉得会在未来深刻的影响到我们的科技、经济和社会的方方面面。他是最早认识到的,而且当时的 AlphaGo 他预言也是非常准确的,所以他几年前就开始深度学习做语音,所以很快弯道超车,语音识别率各方面确实比较高,达到了目前中国顶尖的水平。同时,他们是一家互联网公司,小米也是一家互联网公司,当然我们原来做过软件公司,也做过互联网公司,所以我们跟互联网公司沟通交流是无障碍的。所以我们选了搜狗,而且我们确实看好搜狗未来的发展。
昨天我看到小米电视 4A 的版本已经取消了分体机的概念,能介绍一下吗?
王川:我们是希望做电视中的战斗机,这是高性价比的机型,分体的好处是什么呢?未来大家升级换代很容易,你换个主机就行了,不用换屏幕,屏幕占了电视 60%—70% 的成本,所换主机可以很快速地升级电视系统。这个产品系列我们是给性能要求不是那么高的,不需要持续不断地去尝试最新技术的用户,而且我们虽然是这样的机型,但配置非常好,速度非常快,我认为可以支持很多年的发展。
您觉得语音交互技术在大屏端应用的深度,这两年有没有变化?如果有的话,这个变化主要体现在什么样的方面?
王川:我认为语音技术在大屏上会是一个非常合适的场景,因为什么呢?我们在手机上可以用触屏,很方便,但是在电视上我们今天还看不到比遥控器更好的交互方式。虽然我们把遥控器从原来的几十键、上百键最后简化到只有 11 键,已经比原来跨出了很大进步,但其实你去搜索一个影片的时候,还是非常的困难。所以,我们认为语音是解决这一点非常好的方式。我相信未来的电视能够真正听懂人的各种语言,它可以成为你的助理帮助你找到你想要看的片子,甚至你自己都没有想到的片子。所以,我认为语音从现在到未来几年会有迅速的发展。
如果把大屏端作为很重要的语音方式考虑的话,小米会做什么?比如说基础的语音识别技术是有人做的,语义理解搜索公司可以做,我们做哪一层?
王川:语义是我们在做的,刚才我们也看了语义理解和图象识别,这两部分小米现在都是很领先的。我们今天能拿出这样一个产品让大家看到,其实也是能够体现到我们技术的领先性,昨天大家看到很多都是之前没看过的东西,已经体现出我们的技术领先性了。但是,在语音这一部分,它是一个非常复杂的生态链,就是刚才你说的,从前面有语音识别,到语义的理解,到 TTS 语音的合成,其实仅语义理解这一部分就是非常庞大的。小米虽然做了一部分,但不会全部都做,我们这次也有像三角兽、薄言,还有其他的公司也在跟我们商谈参与一起做,我觉得这些是需要大家一起来做的,所以小米愿意做他自己擅长的一部分,其他部分都跟大家合作来做,我觉得只有这样,才能给用户提供一个真正好用的机器。
我现在看到比较多的应用场景,语音交互技术用于大屏幕电视交互里面,如果放在家的环境的话,小米下一步会有什么样的设想?
王川:我觉得有些场景特别适合语音,一个场景是在汽车里,第二个场景就是家庭的场景。我们一直认为电视是家里的展示中心和控制中心,电视在家里会起到很重要的作用。
我知道电视刚刚加入语音功能,其实小米还有一个智能生态产品,这些智能生态产品包括灯等等,会通过这一个遥控器来实现所有功能的控制吗?
王川:我不知道。你觉得呢?
我觉得是可以打通的。
王川:我觉得小米追求的不是把科技变成一个噱头,小米追求的是在科技变成人人都能使用的这种感动人心、价格厚道的产品。所以如果我们有能力做出这样的产品时,我们会给大家展示出来,如果我们认为没有能力做出来,它只是一个噱头的话,我们就不会拿出来。有时候一些厂家会把科技当成噱头来做,目的是为了拉高毛利,美其名曰提升品牌的溢价能力,小米是反过来的,小米不追求提高品牌溢价能力,不追求高毛利,小米是个追求低毛利的公司,我们把最先进的科技融入到产品中,但是这个产品一定是要用户真实用的,而不是只能展示的,而且这个产品一定要价格厚道。如果我们有能力做出这样的产品,我们会给大家展示出来。
说到毛利率这个问题,昨天发布小米电视 4A 入门机型是 2099 元,团队内部是怎样考虑这个价格的,以及我们的定价策略是怎样的?您刚才说的低毛利率,具体能低到什么程度?
王川:我先跑一下题,我给你举一个例子,比如说我们小米 MIX 手机,去年一发布出来,我看到很多国外媒体的报道,包括说小米提前发布了 iPhone 8,说小米是能够最大胆的想象。这款上市以后,我看到微博还有很多人吐槽,吐槽的是我们定价过低。其实我们内部也有很大的争论,关于小米 MIX 的定价,在上市之前。我就是一个属于主张定个高价的人,主要原因是什么呢?因为我们的 MIX 没有量产性,我们确实是一个挑战极限、探索未来的产品,确实是个概念机,所以我们确实没有量。这款产品做出来以后又非常好,所以我们定位低价其实是便宜了黄牛,我看最高的时候加价加到 45000 块钱,确实是便宜了黄牛。但是雷总在过完春节以后接受了一个采访,他说他是孤独的,因为不管是外界还是我们内部给他的压力都是觉得这个定价不应该定 3999,应该定高一点。
后来雷总说服我的时候是这么讲的,我们不是一个产品能卖多高价就定多高价的公司,我们是一个这个产品能卖多低价就定多低价的公司,我们得要坚持,一次一次向消费者证明我们是怎么做的,才能获得消费者的信任。虽然 MIX 定高价能赚钱,但这不是小米的逻辑。
同样我们的这款产品,不管是 4A 系列还是其他的系列,第一,我们追求的都是低毛利,但是反过来,理论上最好是我追求零毛利,但是我们做不到,因为我们在追求零毛利的时候,动不动就变成负毛利了。所以,我们内部提出来追求低毛利,但是我们不追求负毛利,我不知道你理解不理解,我们追求的是做出感动人心的产品,厚道的价格,我们追求的是我们成为电子行业的宜家、优衣库、无印良品,我们不追求变成电子行业的 LV、爱马仕,我不追求这些。
但是反过来,我们不追求负毛利,烧钱去做,这不是我们追求的。这个可能在座很多记者跟我打了比较长时间交道的都能理解,我们不支持烧钱去做,我们认为那是走火入魔了。在商业上来讲,你必须至少要做到盈亏平衡,这个公司才能生存和发展,所以,我们到今天为止,小米是非常稳健的,我们是盈利的公司。
未来会不会有加价的压力?
王川:我们之前有加价的压力,主要是去年下半年开始,所有的原材料大幅度涨价,特别是以屏为代表的,大幅度涨价,我们其实一直坚持到去年年底没涨。但是这个幅度太大,我刚才讲了,我们不是追求负毛利的公司,所以我们还是要保证自己能够赚钱,我们不赚钱可以,但是不能赔钱。
主要还是屏吗?
王川:各个方面,各种原材料涨价,但是屏涨得比较厉害,因为屏在一个电视中占的比重实在太大,它是决定性因素,但其实是各个方面都在涨价。
涨幅有多少?
王川:涨幅像屏有的高到 60%,假设原来一百美金的屏涨到了 160 美金。每块屏不一样,还是个供求关系,供不应求的它就涨得高,供过于求的就低,所以我们没办法一概而论,具体东西具体分析。所以,我们今天这个定价其实已经是非常低的定价了,如果要放在去年的环境中,我们会定很低的价。
能不能给我们具体再讲一下您讲的这种拒绝负毛利,同时又追求降低毛利的定价策略?比如原来之前是主攻内容方向,我们买版权,这是一些可见的投入,那在咱们研究人工智能,整个研发的过程投入是多少,包括人力、技术、研发,比如说最低机型的定价才 2000 多,是怎么算出来的?
王川:是按成本算出来的。
研发成本之类的。
王川:我们定价是不考虑研发成本的。
但是对一台人工智能电视来说,研发在整个电视中跟硬件成本的比例是一个什么样的关系呢?占比很小吗?
王川:研发投入是很大的,因为它的投入是一次性的,如果我们的量足够大的时候,屏摊到每台的成本其实是有限的。另外一个问题,为什么我们是追求低毛利的公司,我当年去 Costco,我看到的情况是每一样东西都比中国便宜,找不到一件比中国贵的,这个让我非常困惑。因为这里头可能 60%、70%、80% 是中国制造,不远万里从中国运到了美国,卖得还比中国便宜,我真的很困惑。所以我就觉得中国老百姓其实蛮苦的,收入只有别人的几分之一,买的东西还比别人贵,而且还有三聚氰氨、地沟油各种假冒伪劣。所以,当时雷总打动我来做小米,就是因为他说他希望能做一个品牌,这个品牌的产品,用户不用去担心它的质量,不用担心它的价格,就是希望我们能做到我去逛 Costco 的感觉,第一你不用担心质量,因为这里没有质量差的产品,第二,你不用担心价格,因为这是最低价,你在那里需要做的决策很简单,这个东西你需要不需要,如果需要你拿起来就好,如果不需要就不用想了。我们希望小米的所有产品都能做到这个,这是第一,它的真材实料,每个产品都质量信得过的。第二,价格厚道,你找不到更好的价钱了,或者这么说,比我们价格低的一定质量差距很大,比我们质量好的一定比我们贵很多,我们希望做到这样一步。所以,大家进到小米之家,上到小米网,你只要去选,你需要和不需要,这就是我们定价低毛利的原因。
定价原则很简单,第一,我们一定要做出一个高品质的产品,不管是小米 4A 还是小米 4,都是高品质的产品,这是底线。第二,在这个成本基础上,我们能做到这个基础,我们就以很低的毛利,我们理论上理想的是一分钱不加就给你,这个我们今天不能完全做到。雷总跟我说他最理想的终极模式就是有一天送货到你家的时候,你愿意加多少加多少,所以我的理想是一分钱不加给到你,我的模式是消费模式,就是你觉得我服务好质量好,你就添小费,你觉得服务好多添点,觉得服务不好,可以不添,我们的模式是消费模式。所以,小米追求的是这样一个定价模式,你理解我的意思吧。MIX 就是这个例子,我们是贴近成本定的价。
刚才说到低毛利的定价策略,但是我们渠道还是有渠道的成本的,想问一下小米电视在渠道这方面除了线上的小米商城还有小米之家,还跟外部的哪些渠道商合作?
王川:我们今天除了自己的店和小米网之外,还跟京东、天猫、和苏宁易购合作,这些都是高效的渠道,因为我们这种定价只能支持我们在高效的渠道去销售,我们进不到效率低的渠道,一进去就亏钱。
我们这系列叫 4A,可以看成是 4 的补充吗?
王川:不是,我们划成两个系列,一个是 A 系列,一个是标准系列,我们以前做的都是比如说从 1、2、3,我们一直讲,我们在做的是高端旗舰。你可以拿我们的电视去比任何一个厂家最贵、最高档的电视,你可以去比一比,看看我们有没有差,我们原来做的是高端旗舰。今天我们做的 A 系列是另一个产品系列,就是针对主流市场的产品。
在现在这个时间点推出 4A,是对市场有哪方面的考量呢?
王川:高端我们其实已经站住脚了,包括我们这次在 CS 公布了小米电视 4,已经是世界上最顶级的电视。我们今天要扩展开始进到主流市场,我觉得进入到主流市场也非常好,因为我们原来是做高端的,高端我们积累的大量的技术,从画质、音质、系统、工艺这些技术用到主流的机型里去。
想问一下利润这块是来自硬件的利润大还是其他?
王川:我们去年硬件亏损,但是互联网收入弥补了。
能透露一下后项收入这方面的规模吗?
王川:现在还不能,我们没有准备发布这个。去年如果不是凭着大规模涨价,我们去年硬件也有机会不亏损的,但后来因为硬件压力还是很大,我们后来扛到年底,我们承诺要扛就扛到年底,去年确实没有涨价。
现在小米电视累计全国的保有量大概是什么量级?
王川:我们没有公布保有量,我可以跟你讲我们电视终端的保有量,就是电视加盒子我们应该接近两千万了。对我来讲,盒子和电视是一样的,都是互联网用户。
有一个技术方面的问题,去年业界发生一件蛮轰动的事,就是一个国外的小孩用亚马逊语音助手时,他想对方播首儿歌,但是由于错误的识别,给他放了一个成人视频。因为我们这里有一款概念是针对老人和小孩,在准确率方面其实是非常重要的,我想问一下,我们对准确率方面现在能达到什么程度?
王川:是这样的,我们在电视内容上还是把控得很紧的,还不光是我们把控,还有广电总局通过播控平台把控的,在内容上我们特别支持广电总局政策的。因为电视是一个全家的产品,老人孩子都可以用,所以内容健康很关键,我们的内容还是经过严格的过滤的,我觉得都是符合要求的,还是健康的。我们没有不经过播控平台的内容,比如说有的电视可以直接连互联网,能够播互联网内容,我们是没有的,我们全是有版权的、经过播控平台播的、经过审核的内容。这是第一。
第二,今天通过电脑去理解人的语言,我觉得今天还做不到很准确,包括语音识别厂家提的识别率达到 97%,这个数据也是在有限条件下做到的,比如说限定条件下做到的,我自己认为真实使用的时候达不到。我们在努力,我们通过语义理解已经提升了识别准确度,在语音识别准确度的基础上通过语义又提升了准确度,但是今天我们要达到一个很高很精准,我觉得不可能的,很精准、很自然的语言,就是你不管怎么说,它都能理解,我觉得今天还做不到,但是我认为在可见的未来有机会做到相对来讲很精准。这是为什么我认为今天我们看到了曙光。
这是为什么三年前我们大规模投入。在我上中学的时候我就梦想着电脑能够听懂人类的语言,在几十年计算机发展的历史上,计算机科学家一直在努力让电脑听懂人的语言,直到现在,我才认识到这个有可能真的会变成现实。我们为什么三年前开始投入,因为我们认为这个已经开始成为现实了。包括你说亚马逊,虽然出了问题,但是你也得承认它在大部分情况下还是得到了用户的认可,能够达到用户对体验的一个临界点。而且我相信未来会越来越好,随着数据量越大,产品越多,它会越快地达到精准。所以,最先发布产品,最先有大量用户的产品会产生领先的优势。这就是为什么亚马逊会领先谷歌这些公司的原因,因为它最早出来这个。
昨天您在台上演讲的时候,我大概测算了一下,你在介绍 4A 产品的时候,硬件本身的部分我测算了一下时间,等到介绍语音交互人工智能的时候,我又测算了一下时间。如果小米 4A 是一个你很喜欢的孩子,本身硬件部分的提升,或者说电视属性这个部分,和它之后带来人工智能交互方面的功能体验,你自己可以打几分?四六、三七?
王川:是这样的,今天硬件已经走到了一个瓶颈期,短期内来看,我觉得硬件的差异化会比较小,就是因为今天 CPU,我们这种以性价比为主的 CPU 已经很强大了,内存、屏幕的技术已经走到了一个技术的瓶颈期,往前看不到能够有巨大差异化的可能,至少短期内看不到。所以,硬件基本上大家同质化的可能性非常大,真正差异化的会来自于软件和互联网服务,这跟我们当年的预测是一样的。而且在电视也好、智能手机也好,它比电脑进入这种瓶颈期的速度快很多。电脑花了很长时间才进入瓶颈期,在电视上很快就达到了,今天已经很流畅了,再快的 CPU 有什么用处,未来真正的差异化会来自于软件和互联网技术。
放到友商的层面,大家可能都看到这个情况,小米自己在电视这个层面像您说的小费这部分我们可以去碰,友商也作做,小米的优势是什么?
王川:硬件厂家做软件和互联网服务和一个互联网公司做互联网服务你觉得差距在哪?我们做硬件比拼行业已经认可了,最近我到各处拜访各大电视公司的老板,我问他们对小米电视的看法,一个公司的 CEO 跟我说,还咋看?我家客厅是 70 英寸的小米电视,我家卧室是 60 的小米电视,我说你做电视的为什么还买小米电视?他说小米电视好啊,现在每个人跟我谈的都是怎么做小米这样的电视。所以,硬件是我的客场,我先比拼人家的硬件,后面就是我的主场了,就是互联网服务和软件是我的主场,我觉得区别在这儿,那就变成了他们的客场了。
我想听您再深入分析一下,智能电视从硬件的竞争到软件内容,现在又到 AI,接下来竞争的点或者是趋势会在什么地方呢?
王川:我是觉得如果没有小米这样的公司是不是电视厂也会挺沉闷的,小米还是给电视行业带来了很多创新,从最早的遥控器和交互,到后来的分体,到音响,到人工智能,我们一直在挑战极限,探索未来。我自己看到的,第一,硬件我们还是有追求的,大家看到小米电视 4 就能看到我们是有追求的,不是硬件上我们没有追求,硬件上是非常有追求的。但是除了硬件以外,我觉得硬件未来的差异化会越来越小,它原来推动硬件发展的几个核心动力已经失速了,第一个核心动力是屏幕,过去推动电视工业的最核心的,就是从原来的 CRT 到等离子、到液晶,从黑白到彩色,到 3D 等等,我们今天能看到的推动电视工业发展的,原来最大的动力是屏,屏现在已经看不到大的创新了,它现在进入一些很微弱的微创新阶段。第二个推动它的就是处理器,当然处理器也在很短时间内已经饱和了,大家已经不知道该做什么了。当然另外一个,摩尔定律反正大家也在讨论是不是走到头了,过去电子工业快速发展的模式就是从原来比如说一个产品很贵、一台电脑,我上学的时候都是 3 万 7 一台,到现在可能一两千的电脑就比过去强大不知道多少倍,这个可能会发生变化。所以我觉得硬件,今天这两大动力已经失效了,我们能看到的。
然后今天我觉得更大的机会来自软件、互联网、人工智能,这个还是在不断地快速发展,而且确实能够应用到电视中。我们最早先解决了在电视上看内容的问题,我们做小米盒子的时候,我当时记得很清楚,一千多部电影,今天在电视上已经有上万部电影了,当年的小米盒子只有电影,还没有综艺和电视剧,现在已经非常非常丰富了。我觉得最终极的是什么呢?是人类有史以来所有的视频内容都能在这个电视上看到,就是你只要在这个电视上想看任何视频都能找得到,但是有这么海量的内容以后,其实另一个矛盾就突出了,就是怎么样找到你想要看的,你反而觉得很痛苦了。所以,最早你们是用遥控器解决了轻松浏览的问题,接着我用人工智能提升了让你更早的发现,或者好的内容找你的能力,我有语音的话,你只要动动嘴就可以了,语音做到真正好的时候,大家会觉得它的交互方式有可能会比手机还要好用。比如我们举一个小例子,输入 WiFi 密码的那个问题,你动嘴还是比动手更便捷。我是这么看的。
因为小米 4A 给我们很大的亮点,包括很多老师去体验的时候,发现它的语音理解确实不错,搜索很好。但是一说到语音,可能我们很自然就会问到科大迅飞,因为它在语音识别、语义理解方面也很强大,我把您这边的功能转给他们看,我说这些功能你们是否都能实现,他们说除了那个郑爽的前男友前女友那个问题不确定,其他都可以实现。我也问了微鲸,他们也是这样,这个点大家都看到了,您的核心在哪里?这次给我们带来了惊喜,下一个产品能给我们带来多大的惊喜?
王川:这个问题很难回答,我这么说吧,我们做了 11 键的遥控器,今天大家都模仿了,模仿很简单,模仿一个 11 键的遥控器没有任何的技术门槛,但是第一个能做出 11 键遥控器的,当时真心很难。我得把电视现在未来所有可能的功能全部考虑到,才可能设想出一个 11 键的遥控器。今天所有手机都是一个屏幕,前面一个按键,这个很容易,但是乔布斯说手机就是这样的,你说乔布斯有什么技术呢?苹果有什么技术呢?大家都认为苹果是个伟大的公司,它是个技术公司吗?它有什么技术吗?它做的任何东西我们做不到吗?
实际安卓在国内的体验度上还是达不到 iOS 的程度。
王川:不是技术上不行,实际上安卓用的是虚拟机,用的是 java,它是解释执行的,效果比直接执行的效率要低。安卓选择虚拟机的原因是希望在任何一个 CPU 上都能运行,只有后来只有 ARM 的 CPU 可以用。今天看来用虚拟机的方式是错的,用虚拟机的好处是不用再次编译,可以运行在各种 CPU,而今天只有一种 CPU,不需要用虚拟机。如果除去 CPU,完全可以做到跟 iOS 一样的效率,这不是个技术问题,是当年的技术选型问题。
回到现在的问题,第一,我做出遥控器,他们全仿了,如果说遥控器有版权问题,大家不能仿,我是不是就能领先了?我做出分体电视,大家也仿了,如果说有知识产权,大家不能仿,是不是我又领先了?我今天做出人工智能,有没有版权问题?你今天只说我这些都能实现,我同意,核心问题是什么呢?我做技术出身的,我不认为有任何东西他们做出来我就做不出来,我就不能实现,我没有。我上大学写程序我就觉得你做任何东西我都能和你做出一样的,我大不了反对编,堵你的源码,跟你做出一模一样的。但为什么小米先做出这样的遥控器,小米第一个做了分体,小米第一个做了这样好的音响,小米第一个做了人工智能?我其实挑战了极限,探索这个未来是非常大的风险,你怎么知道这个投入进去最后能出结果呢?我已经做出来以后,你们去仿,因为我要做出来,我可能要十条路,九条不通,最后找到一条通的,你们只需要跟着我那条通的路走下去就好了,这就是创新和模仿的区别,模仿是没有风险的,是没有投入的。
为什么西方痛恨我们中国人抄袭,就是因为创新是有代价的,是有风险的,比如说做出小米 MIX 这样的是有巨大的风险,为什么小米第一个做呢?这是巨大的风险。如果不是雷军亲自拍板,是绝对不敢做这样的产品的,因为它是九死一生,但是投入是巨大的。我们抄的话很容易,我们做出来,这个抄那个抄都抄吧。我们是觉得我们能给这个世界带来一些新鲜的东西,能给这个行业带来一些新鲜的东西,我觉得这是我们的骄傲,我们从来没有阻止谁抄我们的产品。就跟我们当年做插线板,我们出这样的插线板之前,大家的插线板都很丑陋,我们出了这样的插线板以后,公牛、网易都出了。雷军说没关系,最终是公牛赢还是小米赢,这不重要,重要的是我们中国的企业赢了。
现在大家都看到了未来人工智能是一个趋势,语音识别搜索在大屏应用,小米抢了首发。
王川:不是抢首发,如果不是我们三年前开始做,我们今天抢不了首发,不是你想抢就能抢得了的。
布局比较早?
王川:我们企业的战略有两种,一种是创新战略,一种是跟随战略,两种战略各有各的好处,都能赢。核心问题是你是创新战略还是跟随战略,小米一直是创新战略。如果没有小米这家公司,咱们不说买便宜的东西,其实你也见不到这样的插线板,你也见不到平衡车。不光是我们把东西做便宜做好看了,小米是一家真正的创新公司,是一家科技公司,我们采取了是创新战略,有些公司采取的是跟随战略,跟随战略也能赢,不是说就不好。从结果来看,跟随战略也是一种战略,我们也可以选择跟随战略。他们做完了,我做一个比他成本更低的,跟他做的一模一样。核心的问题是我今天做了一个遥控器,他们就跟了一个,我做了分体他们就跟了一个,跟吧。领跑和跟跑是完全不一样的,你作为一个企业的领导者和跟随者,完全不一样的。创业的时候,你是领跑的和跟跑的,完全不一样的,是有本质区别的。
能不能讲市场调研,我们在做人工智能这个领域的时候,是怎么决定从语音搜索这块切入?
王川:没有市场调研,因为创新的公司就不会通过市场调研的,乔布斯已经论述过,苹果从来不做市场调研,原因他是一个创新的公司。他给这个世界带来的是这个世界从来没有过的产品,当你问一个消费者,说你想要一个什么样的产品时,他不会说到那个产品的,因为这个世界没有。所以,乔布斯引用的是福特当时举的例子,说你想要一个跑得更快的马,他不会想到汽车的,是一样的。我今天去问大家,你要不要语音这个功能,大家说要,你就做吗?大家说不要,你就不做吗?他说不要是因为他没见过,他说要,你反正只要增加了新功能,我都要。消费者肯定是这样的回答,但是消费者很聪明,当你做出真正有用的好用的东西时,他会迅速的理解这就是我要的东西。
小米定义的人工智能,除了现在语音识别、语义理解,还会有什么?
王川:我们昨天展示了几个方面的功能,第一个是我们通过语音和语义的理解,不能说语音就是人工智能,语音实际上是 20 年前就有的,你不能说 20 年前它就是人工智能。因为原来的语音不是人工智能,原来的语音是靠算法的。今天语音是因为最近几年深度学习对语音准确率的提升。
第二个,我们认识到人工智能未来会应用到各个领域、各个方面,我们试图把这种技术应用在我们自己电视的几个方面,刚才一个是语音和语义的理解,还有机器识别,还有用深度学习的方法去理解大量的内容和用户的使用习惯。我们是想在三个方面使用人工智能。
机器视觉能讲一下吗?
王川:我昨天有一个 PPT,我们机器视觉讲了两部分工作,一部分是人脸识别,我们也展示了一下,包括在人脸识别,我们在 FDDB 的竞赛中得了全球第一名,人脸追踪、人脸识别,包括人的性别、年龄等等的判断。另外一个就是我们对物体的识别、场景的识别,物体识别我们已经能识别一千多种物体了,现在还在增加,给他一张照片,他能识别这是一个杯子,这些都是通过人工智能的深度学习来提升机器识别的能力。
咱们测过语音识别率是多少呢?
王川:其实远低于今天大家宣布的语音识别率。低多少我就不说了,但是在提升。你用迅飞的输入法,你自己看看是不是像他说的只错三个字。各家我都测过,各家的差异真的是微乎其微,为什么说都达到了 97%?迅飞做 97%,搜狗 97%,百度也是 97%,他在有限场景下测确实能达到 97%。
长虹公布的也是 97%。
王川:不是长虹公布的,是人家迅飞公布的,迅飞、搜狗、百度公布的,他们是 97%。但是,我刚才讲了,它是有限条件,比如说要一个安静的环境,测完以后优化到系统,我觉得三家都达到了同样的水平。今天的核心是什么呢?原来语音是靠算法,是需要大量的算法来去做的,迅飞积累了很长时间,积累了十几年,他们是最领先的。但是,今天拥有了深度学习以后,那些算法就完全抛弃了,现在是用另一套方法重新干,所以大家又站在同一个起跑线上了,他的这个提升是取决于语音库的,谁的最丰富,就会越来越精准。
比如说 AlphaGo 赢了你,是因为它学了三千万盘棋,而且这还不够地它又学了周伯通左右互搏,自己跟自己下,通过大量的训练,使得自己的技能逐步提高,下得越多,能力越强。人的问题是你不可能下三千万盘棋,机器可以不眠不休,不停地下,下得越多,能力越强。深度学习是需要大量的数据的,在语音方面需要大量的语量,在图象识别需要大量的图片来给它学习。所以,为什么亚马逊在语音技术上并不是比谷歌那么领先的公司,但是今天的它就是比谷歌的要好有,因为它很早就收集了大量的语料。今天的领先不代表明天的领先和未来的领先,是谁能收集到这个场景中最多最大量的语料库,比如说电视上最重要的可能是找电影,对于这个场景来讲,最大量的语料库谁最早涉及到,谁就最有机会。因为深度学习算法都是公开的,都是开源的,每个人都能用那个算法。今天的算法不是最核心的,这就是为什么所有大公司把算法开源,今天核心的是有大量的数据,所以,谁有这样的大数据,谁未来的识别准确度就会很高。
我问您个人对小米产品本身的。
王川:核心问题就是我们是一家有创新能力的公司,这样我们才选择了创新战略,而不是跟随战略。今天的苹果已经没有创新能力了,它只能选择跟随战略了,今天有些公司是有创新能力的,有些公司是没有创新能力了,你只有有创新能力才能选择创新战略,而不是跟随战略。曾经的索尼是非常有创新能力的公司,今天也没有了,后来是苹果,苹果极具创新能力,但今天也没有了。所以昨天发了一个中国红,科技换壳为本了,这不是我讽刺,在本质上来讲,它需要创新能力,创新能力需要有冒险精神,需要能够挑战极限,去探索未来。我们的梦想是把未来的产品拿到今天来,我给大家带来未来的产品,所以我们一直不断地在探索未来的产品是什么,从我们第一款遥控器到分体,我们都认为这是未来的趋势,到人工智能。
所以智能电视会不会以一个社交化的形态成为一个新的创新点?
王川:有各种可能性,只是你要判断什么是未来,然后你还有能力去实现未来,比如说你可能判断社交是一个点,你就投入了,有可能证明你看对了,有可能证明你看错了。反正看错了,你的投入就打水漂了,这就是风险,但是你投入进去证明你是对的,你领先了,那你就是一个创新的企业,大家别人马上就会抄,他只抄你对的就好了,因为市场已经验证你这个是对的,他只要抄就好了,就是这么一个过程。所以我只能给你讲,我们看历史小米电视是一个具有创新精神的企业,给这个行业带来了很多创新,我们小米电视从发布到现在三年时间,在这三年过程中,你可以看看其他企业都发明了什么。你说未来我们会做什么,今天肯定在做的东西我没法跟大家讲,我没法把我没发布的产品跟大家讲,就像我都没法跟你讲小米 6,小米 6 我都在用,我都没法跟你讲。
小米电视现在可以说某某某第一次出现,谁跟谁第一次见面是哪一集,撞车、杀人,也可以识别出这样的镜头,还有什么能识别?比如说谁跟谁来电了,开会,或者说是密谈之类的。
王川:今天大家做的还是物体的识别,还做不到对场景的理解这一块,我觉得这个要求更高。今天我们可以人工加自动,它不是纯粹的自动,自动帮你识别这些物体,你人工标注那个场景,它可以结合去识别,但是对用户的体验来讲,我想看开会的镜头,它就给你找到。这在过去是不可能的,因为一个这么长的电影,如果哪一帧都靠这个是不可能的。
现在比如说一部比较长的电影在小米大脑系统里跑一圈大概多久?
王川:现在还挺长的,现在还不到工业化的程度,所以我们只是做了一部片子上线了,给大家看,大家现在还是探索性的工作,还没有到高效处理的地步。机器能标明哪个场景的物体,我们现在能识别的物体在不断地增加,现在已经有一千多种物体可以识别。在这个基础上,人工标注那些关键的场景,就是有意义的场景,人工标注的这部分取决于你希望它能够到什么精度了。
还有一个技术上的问题,关于语音识别、语音控制功能,为什么当初技术选型的时候,选在你需要找到遥控器,然后按一下按键才能说话?为什么不是用一个启动热词直接下命令?
王川:远场识别,第一,它的精度没有这个高,不是每次都能唤醒的。第二,也有用户在乎隐私性的问题,因为它实时在收听你的所有谈话,这是第二个问题。第三个,在看电视这个场景中,远场的还是有巨大的挑战,因为它声音很大,而且远场如果放在电视那端,电视本身的声音比发信号的声音离它近很多,而音量是跟距离的平方成反比的。人能够听到你说话,能够区别你和电视的说话,它的这个能力不是今天我们的科技能达到的,它是一个非常复杂的机制,它是包含了理解在里头才区别开的。
我想问一个非技术相关的问题,现在越来越多的内容公司也开始做互联网公司的,像前段时间芒果 TV 也发布了计划。如果按照这个趋势来做的话,越来越多的视频或者内容品牌会介入这个市场,您觉得对小米的冲击是否会带来很大的影响呢?
王川:我个人看法他们不应该做电视,是这样的,我们每一个公司都有自己独特的能力和基因,做内容的能力和做硬件的能力完全是两种能力。一个公司同时具备这两种能力是非常难的,同时在两种能力上都达到业界最高水平,我觉得基本上可能性是微乎其微的。所以我认为为什么小米坚决不做内容?是因为小米认为自己很难具备内容的基因,小米转过来,做杂志能干过你们,我觉得也不相信,反过来你们说转行干电视,我也不太相信。
假如说他们考虑合作的模式呢?
王川:我们一直是希望合作的模式啊,我们一直在这样寻求合作,因为不管电视也好、手机也好,各种互联网硬件也好,它的产业链非常非常长,其实比传统的要长很多。原来来讲,传统产业链已经非常长了,但是它在传统的产业链上又增加了新的产业链。我不相信一个公司能把整个产业链全部做得特别好,所以,小米一直的策略就是我们只聚焦在自己擅长的部分,其他的部分全部跟业界最好的公司合作,一定是合作的方式。包括当年我们跟乐视的内容之争,我们说我们是开放的模式,他们是封闭的模式,当时这个争论到底哪个模式会赢。我们当时的观点是在互联网历史上无一例外是开放的模式赢,乐视给自己起了个名字叫开放的闭环,到底是自己做内容会赢,还是聚合模式,跟所有有内容的厂家合作的模式能赢。因为开始的时候,你看到他们是领先的,因为他们买内容快,你要合作的话,你需要说服大家愿意跟你合作,这需要很漫长的时间。但是今天胜负我觉得大家已经看得很清楚了吧,小米电视上的内容和乐视的内容已经是天壤之别了。
有 Air Play 的功能在,我很容易把腾讯的内容投到乐视上。
王川:但是这种功能使用得不多,我们在技术上的判断,大家用电视,今天最好的交付方式还是一个遥控器,虽然这个遥控器已经存在了几十年的时间,但还是没有找到更好的。其实大家也探索了很多方式,包括触摸的方式,包括体感的方式,包括现在语音的方式,今天我们还是抛弃不了遥控器。最理想的情况就像她说的,遥控器不用了,直接一个词就好了,只是今天的科技还没有达到这个模式,能够达到用户真正可以接受的点,如果能达到这个点的时候,我相信会好起来。我们只能站在今天这个时间点看这个问题,今天来讲,这个遥控器还是最好的遥控器,包括你说的这些方式都不是今天用户主流的交互方式,我们全支持了这些功能,但是用户用得很少。
再问一个硬件问题,您也去过 CES,你怎么看 CES 上索尼发布的电视,还有三星特别细的那根线?
王川:这是两件事,第一,OLED 去年大概 100 万台,在全球,全球有两亿多台电视机的销量,只有 100 万台,它只有这么多供应量,所以对整个市场没有办法产生决定性的影响。今年产能会增加,但是也到不了多少,目前只有一个屏就是 LG,去年全球只有 100 多万块屏,是非常小众的市场,对整个大市场不会产生重大的影响。OLED 电视我们只能用来做噱头,索尼也达不到这样的,它想多生产也生产不了,这种情况下,这个屏就很贵,不是普通老百姓买得起的。如果我们拿它做噱头可以,发布一下,卖几万台有可能,总共 100 万台,大家就分吧。你想卖 100 万台还没有,总共就那么多屏。我认为索尼今年主要的肯定不是这一块。你注意他真正主流的产品绝对不是这个,它只是在 CES 上作秀的,这是我的看法,主流产品肯定还是 LED,一定的。因为如果它只靠 OLED 的话就破产了。
你刚才说的那个连接线的问题,解决的是什么问题?放在你家里更漂亮一点的问题。光纤能传信号,不能传电流,电你还得有电源线,它挂在墙上会更漂亮一点,这一点没错。但是那条线也很贵,因为两边要把电气化转为光纤,光再传输和接收,这两个模块现在成本还是蛮高的。你这个问题是一样的问题,可能一些小众的、高端的用户会愿意买单吧。
刚才您讲了去年小米电视这一块硬件是和互联网收入可以相互打平的,互联网收入在构成上大体是什么样的?
王川:这个我们还没有准确数据给大家公布,我只是给大家讲一个概念,就是我们整体公司打平,硬件我略亏,互联网收入开展增长了,所以就把亏的给打平了,整个公司是低毛利状态,但是是盈利状态,跟我们预期是一样的,只是后来没想到互联网收入上来了,去年硬件涨价以后导致硬件亏损了,但是最终结果还是打平了。
您说团队三年前就开始大规模投入,是指语音交互技术还是?
王川:人工智能。我可以跟大家讲的是什么呢?人工智能不是一个新的题目,其实在人工智能历史上有两次高潮,当然后来都沉寂了,主要是因为那两次大家都看到了曙光,认为人工智能有可能真正能被应用到,但实际上最后都没有真正实现应用。在过去几年,深度学习的出现,真实的使这个技术成为一个使用的技术,它产生了科技的突变。深度学习的技术我觉得可以用于各种领域,它可以用到语音领域,提升语音的识别度,可以应用到机器视觉,提高了视觉的识别度,因为原来的语音也好、视觉也好,原来都有,也不需要人工智能,是靠算法,靠工程师不断做算法来做到的。但是今天深度学习重新做了这个,识别度比原来做算法的更高了,所以它是弯道超车,以前你做的算法没用,它是一个全新的方式。包括刚才讲的对内容的理解、翻译,自动驾驶,这些都是深度学习带来的变化,原来的这些都是用算法做的,但都达不到真正实用的状态,今天深度学习提高了准确度以后,使它达到了真正可用的状态,而且深度学习会帮助他们不断一步一步再提升。
您刚刚提到的深度学习那边都是在机器训练,小米会在一些比较前沿的技术做什么研究呢?
王川:我们不会投入去研究我们不能融入到产品中的技术,你懂我的意思吧,我们先把今天已有的技术怎么融入产品中,所以我们更关注能够迅速产品化的这些技术。因为我们不是研究院,我们不是研究机构,我们是一个产品公司,我们只是希望把今天最前沿的这些技术能够化繁为简,融入到感动人心、价格厚道的产品中。无印良品、衣衣库、ZARA、宜家也没有什么科技,如果把科技拿出去的话,我们本身是他们这样的公司,我们有设计、有高效的能力、我们能给大家提供物美价廉的产品,本身我们是这样的。同时,我们自己因为我们八个联合创始人,有两个是设计师,六个是工程师,所以我们本身都是工程师和设计师做的公司,我们本身是科技工作者,在这些公司之外又加入了科技部分,但是科技部分我们追求的是能够被用户所掌握和使用的技术,而不是理论研究性的,我们不太关注。主要是我们在过去意识到了深度学习导致了技术的突变,我们认为它在未来 10 年、20 年里头能提升各行各业很多方面,包括医疗、交通各个方面,我觉得会有重大提升。而且也会替代很多人的工作,也会对人类从经济到社会都产生重大影响。
您对电视行业的发展是不是觉得现在到了一个行业竞争的拐点?从过去的内容比拼,现在到了一个人工智能新的竞争时代?
王川:你这么理解我觉得也是对的,刚才说了,第一,原来最早比拼的是硬件,现在硬件进入了平台期,接着比拼内容,因为当时内容很少,我们刚才说了,我们小米盒子发布的时候只有一千多部电影,其他什么都没有。所以,内容从稀缺到最后很丰富,当然我觉得还没有到一个极限值,极限值也永远达不到,我觉得极限值就是人类有史以来的所有视频内容你都能通过电视去看,我觉得这是极限值。我觉得我们今天在电视上内容大家已经看不完了,接着是到了互联网服务,人工智能这个领域。
以往我们说视频方面因为资本金各方面原因出现了价格虚高,小米这些硬件厂商跟他们合作的时候会不会价格过高?现在回归相对理性?
王川:第一,中国视频行业的格局今天已经非常明朗,我个人认为未来能升级的只有三家,爱奇艺、腾讯和优酷,未来其他家能不能存活都是一个很大的问题,有可能在垂直领域存活,作为一个通用平台存活的可能几乎没有了。今天大家是处于一个淘汰赛的过程中,拼命烧钱,巨额亏损,把大家都甩在后头了,惊心动魄,我恰好是这三家中两家的投资人,所以我看得比较清楚。我是爱奇艺的董事,爱奇艺的所有数据我都有,但是我不能讲。所以今天的格局大概就是这样,小米很好的看准了我们应该投哪家,所以三家中我们投了两家。
在内容方面,小米比如说跟乐视相比,它的优势可能是说已经投中了三个巨头里面的两家,因为有股权投资,所以内容还用购买吗?是不是以一个低于同行业的价格就可以拿到他们的片源之类的?
王川:你还没搞清我的模式,我的模式是不买片源。今天大家视频网站都是巨额的亏损,每年亏损都是几十亿的规模。我刚才想格局是淘汰赛,你说内容价格虚高是因为在淘汰赛里,都想把对方弄死。今天有钱买内容的都是三家,他们都跟我讲,今年内容投入会超过 150 亿。真的假的我们不说,反正代表投入巨大,今年大家都会巨额投入。有钱的人才能拿到好的片子,没有钱的就拿不到,你知道吧?所以,今天的核心问题,如果小米买内容,我们是根本没法跟这三位老大哥去竞争的,不是我们竞争不了,乐视也竞争不了,乐视今天也拿不出 150 亿去买内容。主要这三家都是「BAT」,他们有非常雄厚的实力来比拼。所以,我们的方法就是从一开始我们就设定我们如果买内容这条路是死路一条,我们一定要跟「BAT」这三家,三大网站结合合作,他们买了,我们在里面分成。只有这一条路,如果我自己买内容,我肯定连乐视就做不过,乐视就买内容,今天他卖不动了。为什么今天大家抱怨乐视内容不好,比小米差很多,你可以看看大家的抱怨,因为小米里头有爱奇艺、腾讯、搜狐、PPTV 的内容。乐视刚失去了亚冠和中超,小米电视有啊,就是因为我们跟大家结盟。
你讲到小米电视做深度学习,这其实是件相当技术的事情,在深度学习领域,还有比小米更有 DNA 和天赋的公司。
王川:我觉得深度学习是一个新技术,但是我不认为这个技术有多么神秘,别人无法掌握。我认为深度学习,第一是开源的,各大公司,比如谷歌和 Facebook 都开源了,他们的法都是开源的,大家掌握这些开源的算法工具只是一个时间问题,我不认为这件事是很神秘的一件事。这是第一个问题。
第二个问题,未来真正有竞争优势的是什么呢?是有数据的公司,我刚才给你说了,深度学习是数据,你没有数据光有算法没用,这就是为什么大公司开源算法,就是为了获取数据。
第三个,核心问题你怎么把它应用到产品中能够真正落地?给你演示一下和真正让你用起来,我觉得其实来讲在这方面亚马逊是做得特别好的,就是产品能落地,有大量用户就能收集大量的数据,形成一个良性循环,他就领先了。
亚马逊有一个成功的地方就是形成一个闭环,这个模式是我们小米电视要做这件事情的吗?借由语音这样技术的工具发出指令,指令得到服务,服务得到满足,是这样的吗?
王川:不是,任何一个产品都是闭环的,亚马逊真正先进的不是这个,亚马逊产生的是生态系统。它是真心的生态系统,不是贾总说的生态。我看人说的,贾总说的所谓的生态是莫须有,是不存在的,亚马逊是真正的生态系统,就跟苹果在 iPhone 上产生的生态系统一样。什么叫生态?生态的核心就是说在这个生态里头,各个厂家都能参与,都能有贡献,都能获利,不是一家玩叫生态,社会上任何厂家愿意参与都能参与进来,都能有贡献,都能获益。所以,苹果是通过 APP store 生成了一个生态系统,如果你做一个公司,你说我想开发一个放 APP store 上面去卖,我自己赚钱,跟苹果分,这是可以的。你同意吧?这是生态。亚马逊今天也产生了一个这样的生态,它的能力数量从今年年初的 4000 个已经超过了一万个,就是因为有大量的其他公司在他这个生态里建立了各种能力,一方面扩展了它的使用体验,一方面这些公司也能够通过这个生态系统获益。我觉得这是它的优势。