【虎嗅夏季F&M节】百度张潼:深度学习接近人脑,是巨头竞相追逐的未来

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
【虎嗅夏季F&M节】百度张潼:深度学习接近人脑,是巨头竞相追逐的未来
虎嗅注: 虎嗅FM节上,百度研究院副院长张潼发表了有关于深度学习的主题演讲。现在为什么大家都很重视深度学习?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型有其独特的优势。在张潼及百度的愿景里,深度学习的意义是研发出最接近人脑复杂程度的模型,而这也是Google正在追逐的未来,这可能是互联网公司目前正在进行的最前沿研究。以下是他演讲的主要内容,虎嗅进行了编辑。
这是我第一次来深圳,也是第一次来虎嗅参加类似的活动,我是搞技术的,我做的更多的还是面向于偏技术的,我很高兴跟大家分享。如果大家跟数据有关系,特别是互联网企业都会对数据打交道,深度学习近年来是非常火的概念。

很多人对深度学习感兴趣,包括VC等等,他们看到的是什么呢?很多互联网公司会对技术非常感兴趣。像谷歌做了很多事,2011年成立了谷歌大脑的计划,这个比较著名的人是Andrew Ng,另外一个是Jeff Dean,他们当时的目的是想建一个世界最大的深度学习网络。
 我跟大家分享一下这个技术能做什么,为什么大家的兴趣那么大?互联网,大家说大数据,为什么我们这么重视数据,百度要用数据来做智能化,特别是人工智能实验室,一个是数据,一个是智能,这两个是关键词。互联网目前是几种模式,如果看BAT的话,一个是联接人和信息,像百度,阿里是联接人和商品,还有腾讯和facebook都是联接人和人。主要是这三个模式,另外还有线上线下。

这些实际上都是数据驱动,跟传统的不太一样,互联网企业讲快速迭代,一个是数据驱动,这样要进行很多分析。特别是进行到一定的程度,比较高度的时候,你需要提取数据,其中一个是数据制导,比如百度的搜索技术、语音技术等等。深度学习更大的概念是机器学习,如果我们看一个图的话首先是有大数据,然后是分析,包括建模,用高效的算法解决这些模型,然后集合到你的系统里面,最后就成为一个智能化的系统。深度学习在整个流程里面最主要的是复杂模型,像人脑的模型,这个模型的效果非常好。深度学习是互联网数据分析必不可少的。

我们说一下语音,这是深度学习用得比较广的领域,你说一句话,通过计算机给你翻译出来。机器学习有输入输出,输入是声学信号,输出就是变成文字,比如说你好或者其他的。问题规模是非常大,基于大数据,百度或者类似大的互联网企业都是上万小时的语料,数据规模是百亿级,类别上万类。你进来的是一些文字,最后你希望用它训练出来一个模型,而这些模型最后可以在线上用。模型在这里是深度学习的模型,这是目前效果最好的一个方式。计算技术上需要大规模的计算技术,有一些技术的瓶颈需要处理。

从模型上来讲有两种,深度学习相对应的概念是浅度学习,浅度也是一个机器学习模型,它的意思就是人工要抽取特征,通过人工的方式变成计算机可以识别的,然后学习跟学习线性组合。后来发现数据量变得更大的时候,你可以用更复杂的模型,这些模型包括深度的模型,它的好处就是可以从原始出发自动学习组合,这样的能力是人工不足的地方就用机器代替,然后要并行大数据,另外要很大的计算能力,这样就能得到更好的效果,就能实现类似智能化。

智能化是今后十年大家最关注的技术前沿,这从技术瓶颈上也是非常高的。举一个图像识别的例子,它怎么从产生到生成,然后学习一些比较高级的。比如开始进来的都是一些图像的像素,后面一层就会有一些边出来,再下一层就是学习特征,再上面就组建成人脸。这种信息是自动学出来的,不是人制造的。传统的学习方法是人来做的。语音也类似,也是从低到高慢慢建立起来的。 另外它非常像人大脑的结构,深度学习本身是模拟大脑的,它的结构跟大脑走得非常近。从某种意义上来讲深度学习跟人脑是非常近的。图像识别传统的方法是在2010年用浅层模型,达到了74%,到2012年有了非常大的提升,达到了85%。

现在为什么大家都很重视深度学习呢?最主要的原因是数据量比较大,计算规模变大了;此外,复杂模型独特的优势就会显现出来了。 想象一下将来数据会越来越大,特别是互联网里面,各位如果创业的话对数据也非常关心,将来也是非常大的数据,建立复杂模型也是非常重要的。

数据规模,首先是成倍的增长,包括广告、语音、图像等等。另外一个是计算能力,其中有一个代表,GPU的出现,你计算是用CPU,最近深度学习用得比较多的是GPU,GPU使得计算能力大大提高,GPU一两个星期能处理的数据,CPU可能要一年。还有复杂的图像模型。最后要有一些算法支持它,它有异步式的算法来支持它的计算。

我们的目标是使计算机更加智能,这是在座各位想做的事,要智能,能够理解人,能够知道意图。我们现在的手段跟以前的区别是我们有大数据。那我们就要分析它,复杂模型就很重要。计算能力也上去了,最后要做一个系统才能达到你的目的。深度学习是非常接近人脑,第二是向人工智能走得非常近,也许它不是最终的目标,但是有很好的效果提升。
加入文集

随意打赏

提交建议
微信扫一扫,分享给好友吧。