专访搜狗王小川:搜狗的语音识别比阿里和科大讯飞的好

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

专访搜狗王小川:搜狗的语音识别比阿里和科大讯飞的好

王小川接受凤凰科技专访

凤凰科技讯 11月17日消息,在第三届世界互联网大会开幕当天,搜狗CEO王小川接受了凤凰科技的专访。在采访过程中,王小川表示,与阿里云和科大讯飞比起来,搜狗的语音识别技术是最好的。

谈及原因,王小川告诉凤凰科技,阿里本身它的专项不是在做输入或者语言,它在现场演示的时候还会出现一些状况,但搜狗就完全不会出现这样那样的问题;和科大讯飞相比,搜狗本身是to C的,而科大讯飞更多是一个to B的公司。它的基因是给企业提供这种服务或者接口,所以这方面搜狗的语音技术、输入技术以及用户的产品满意度,都是搜狗的基本优势。

谈及业内一直热议的中英混杂语言的语音识别,王小川认为这不是一个瓶颈,“只要有足够多的语料数据,这个事情就能突破。因为我们以前在训练的时候的话,我们拿到大量的语料句子都是中文的语音和中文的文字,英文的比较少,所以现在效果就不算好,因此只要增加这部分的语言量,这个问题就可以被突破,实际这也是今天深度学习人工智能一个瓶颈,就是大量的历史数据,历史经验来驱动它,没有历史数据,没有历史经验,它就做不好。”

对于人工智能领域的创业,王小川认为那些有现成的服务和数据能力的大公司更容易成功。他表示,目前中国本身在基础的科研能力就不足,而且人工智能还依赖数据规模,但这些资源初创公司都无法获取,所以在人工智能领域,能做成的创业公司将是微乎其微。(白杨)

以下是王小川接受凤凰科技专访实录:

记者:川总您好,在阿尔法狗战胜李世石的时候搜狗放了一天假,叫狗胜节。当时您怎么看待这一次的胜利?    

王小川:因为首先搜狗公司对人工智能是非常的关注,因为本身做搜索引擎,其实背后大量用到了机器学习和人工智能相关的算法。因此,人工智能的突破,就意味着搜索有新的一轮春天,这是我们认为未来改变世界最重要的一个力量。所以阿尔法狗这个事情的时候我们就会非常的认真,包括我之前也做了预言,阿尔法狗会赢,还赌赢了不少钱。

所以这个方向我也是想从一个侧面给公司的员工一个更清晰的信号,这个事情跟我们是息息相关的,所以我不是光去看噱头或者是传播的效果,我是认真的给公司的员工,让他们知道我们对人工智能的重视,这是一种喝采,这是我们的一个时代到来了,因为阿法狗这个事情代表一种精神是,工程师在面对一些复杂的问题的时候,开始处于更主导的力量,比如说在医疗,以前的做法更多是专业的医生,他们这种意见。但是随着人工智能的发展,数据的积累之后,会让算法的工程师在这里面能够有更多的话语权,所以在这种情况里面,各行各业里面都会用到更多的技术去突破,所以也有工程师给我发信息说,老板我明白了,我认为作为一个工程师,作为一个技术人员,我们的价值会更大,那我觉得达到我们要的效果。

记者:现在很多公司都在做人工智能,包括谷歌、百度他们都在提,搜狗目前在这块取得了哪些成果?

王小川:搜狗本身关于在人工智能,基础的地方是在语言或者图象层面的进展,搜狗因为是做输入法的公司,因此我们会看到本身而言,对于输入法往下的沟通交流方式里面,有些场合里面更适合用语音的方式,这部分我们技术已经非常的成熟。搜狗输入法里面就会内置我们语言识别的引擎,我们从2011年开始,这方面开始做研发,也赶上好时机,就是因为深入学习技术的突破,使得语言识别开始能够变成真正的使用,跟人一样的效果,这是我们作为输入法的进展。

从搜索引擎里面,你会大量用到深度学习的这样一个技术,因为以前在网页排序的时候有很多规则,靠人在里面调优。但这个技术一大好处是,用统一算法就能描述了,所以搜索本身会变得更加简单,这里面一个技术突破点就是对语言本身的理解,这是很前沿的一块,中间最大的突破是跟翻译相关的。

因此,我们在输入和搜索里面处理的不只是中文,而是在中文和英文之间能够做一个跨语言的检索和跨语言的输入。比如说当你输入一个中文句子的时候,发送的时候就转成英文了。检索内容的时候,也可能你检索的内容是用中文的输入,你可能获得是一个国外的资讯,这是我们在做的一个工作。

这次参加乌镇大会,明天我们就会做一个发布,就是在现场的移动互联网的分论坛里面,我们做演讲的时候,同时屏幕上就会出现你所演讲内容的中文字母和翻译之后的英文字母,真正做到了不仅是取代了速记员,甚至连同声传译的这个翻译,我们也开始进入到对它的一个辅助或者一个颠覆。

记者:像包括科大讯飞,还有阿里云,他们在多个场所都已经展示了这项技术,您觉得搜狗在这块技术上跟他们有没有差距?另外一个像科大讯飞这种专业做语音识别技术,再去做输入法,跟我们就之间竞争会出现哪些问题?

王小川:提到科大讯飞和阿里,在这里面搜狗技术是里面最好的,一方面阿里本身它的专项不是在做输入或者语言,咱们知道在之前开云栖大会的时候,事实上现场演示一半,后来就停机了,我们之前做过发布会,不会出现这样的一个问题,在技术上我们是有信心的。但是科大讯飞比较起来,我们本身是一个叫to C,就是给用户提供产品的公司,科大讯飞更多是一个to B的公司。它的基因是给企业提供这种服务或者接口,所以这方面我们的语音技术,包括我们输入技术,跟用户这样一个产品满意度,会是我们的基本优势。

记者:像语音识别技术,中英混杂是不是一个难点?未来有没有可能突破这种比较复杂的语言?

王小川:你刚刚提到中英混合这个问题最简单一个理解就是,只要我有足够多的语料数据,这个事情就能突破。因为我们以前在训练的时候的话,我们拿到大量的语料句子对,都是中文的语音和中文的文字的,我们的英文的比较少,所以现在效果就不算好,因此只要增加这部分的语言量,这个问题就可以被突破,实际这也是今天深度学习人工智能一个瓶颈,你就是大量的历史数据,历史经验来驱动它,没有历史数据,没有历史经验,它就做不好。

记者:现在人工智能创业也非常火,您怎么看待这个行业的创业?

王小川:人工智能其实有两个源头的能力,需要突破的一件事情就是,核心技术的突破,这种技术突破,通常是发生在高校,或者这种顶尖的像搜狗,或者说是一些研究院,这种技术突破在中国其实是很困难的,因为我们互联网虽然发展的很好,但是我们的基础的科研能力其实并不足,所以我们以前互联网成功也不是说技术比美国更好,还是依赖于我们本身的人口红利,依赖于我们的创新。

那么在积极学习和人工智能领域里面,除了论文或者高度的技术以外,还有一个要点,就是数据规模。在数据规模这件事情里面,它是原材料,有了数据规模做加工,我就得到这样一个智能。而这种数据更多是在大公司手里面,因此在人工智能创业公司,其实今天都会面临一个很大的困难。你的技术有可能比美国这种技术研发会弱,但是你又没有大公司掌握这么多的数据,所以这样一个人工智能创业领域里面,最后能做成的这种创业公司,其实是微乎其微的。

很多它如果确实有一定成果,可能会选择被卖掉,就是卖给大公司,这也是生态进步的一部分,所以人工智能创业里面,我其实更倾向看好,比较偏大的传统一点的公司,已经有现成的服务和数据能力,然后再去收购一些小公司,去提升自己的技术能力,最后达到一个产业升级。

记者:输入法这个行业,它同质化非常严重,你怎么看待这个问题?您觉得像刚才我们说的新技术,会不会给行业带来变革?重新产生一个新赛道,让很多刚才说的初创公司,或新型公司,和我们这种积累很久的一些公司,站在同一个起跑线上?

王小川:我先说赛道这个问题,其实对于创业公司而言的话,它最好是选择大公司比较难进入的赛道,就是我有主干道,其实我不去做反而是它的机会。如果这个赛道他就要做输入法,我在技术上可能比你更好去突破,这件事情从历史规律讲是不成立的,在创业者的窘境也提到,它通常的进展是来一个你不愿意做的事情,而不是说能比你做的更好。

因此在赛道里面我不认为小公司跟我们做输入法上会有机会。另外你提到一个同质化的问题我倒觉得不算严重,比如说在PC领域里面,除了我们以外,之前包括腾讯也在做输入法,然后其实当时像盛大、新浪各个公司都在做,最后其实我们是唯一能够获胜的这家公司,有的时候在用的时候你可能没觉得好,但是你离开的时候你发现你受不了,这个体验是在细节里面的,不是表面上看到的同质化,有很多深的功力在。

随着现在人工智能技术的发展,我们应该在今年内就会面临输入法重大的一次升级,不是简单讲的拼音的输入,也不是简单讲的语音的输入,而是它能够变成一种用智能的方法去帮你去做辅助的输入,或者辅助的回答。什么意思呢?比如说你的女朋友或者你的老婆跟你聊天的时候,你看到这个句子,你想该怎么回答?机器可能在你没想明白之前,就生成了一段话,你只要确认发过去就行了。其实我们现在看到这个,以微软小冰等等开始做对话系统,或者是一些对话聊天系统,都是一种玩具没有到使用的这个阶段,都是闲聊,但在输入法里面,我们在输入场景里,能让它去辅助你,甚至是取代你,一个极端情况,你聊天的对面也许是一条狗,只是通过搜狗的输入法,所以在人工智能领域里面,我们会开创这样一个突破。

记者:PC端和移动端的产品也有很多差异,这两个现在是分开去运作的吗?

王小川:两个团队其实合在一块的,其实不同的产业不一样,比如像淘宝的购物,PC购物,无线购物它一定是合在一块的,工具类的产品会难一点,比如说PC浏览器,或者无线的浏览器,可能会远一点,但大体上我们把它变成一种服务,比如说我们刚才说延伸到未来对语言的理解,那么它其实合在一块,都是帮你去回答一个问题,分的没那么开了。我们认为成功的互联网服务,不是简单的去分PC或者无线的,它一定有贯穿的对用户需求的一个满足。

记者:川总最后一个问题,关于搜狗整个未来一些人工智能,这些技术的应用,我们有没有一个规划或者畅想,未来会达到什么样一些展示的成果?

王小川:我们时间比较已经很快了,在今年内,大家就可以看到输入法的升级,就开始用了人工智能技术之内,能改变你的输入习惯,那么搜索也在明年内,大家也会看到一些,由于人工智能带来一些颠覆性的力量。

随意打赏

搜狗ceo王小川科大讯飞输入法搜狗王小川科大讯飞
提交建议
微信扫一扫,分享给好友吧。