4张图看懂今天百度最近发布的人工智能云平台——“天智”
百度曾在今年7月发布了百度公开云战略。推出天算、天像、天工三大智能平台。4个月后,百度云的“平台组合”又增加了一个新成员:天智。
在今天举行的2016百度云智峰会上,百度正式对外发布了自己基于云的人工智能应用平台——天智。这个平台由三个部分组成,分别是感知平台、机器学习平台与深度学习平台。
对于用户来说,三个平台的应用方式并不相同
其中,感知平台已经在今年9月百度世界大会上被详细介绍过,这个平台主要输出是图像技术、语音技术、自然语言处理的技术。
感知平台
其中,图像技术的话包括了文字识别、人脸识别等等,而语音技术包括了语音的识别和语音的合成,声纹的识别等等,而自然语言处理则包括了百度的NLP Cloud的能力。
百度云事业部总经理刘炀在解释这个平台的作用时,提示我们需要记住一个字——聪明的“聪”。他表示,“聪”是由耳目口心组成的,而“耳目口”的功能都是百度感知平台能做到的——语音识别、图象识别以及对自然语言合成。
因此,在他看来,与其他两个平台相比,百度感知平台有一个特点:由于这个平台都是基于百度自己搜集的大量人机交互数据来学习并生产模型,所以其API能够由外部直接进行调用。因此,用户其实不需要我们弄懂其中的技术细节就能使用。
换句话说,感知平台可以触及的用户群体在三个平台中也是最大的。
第二个是机器学习平台,机器学习平台跟感知平台不一样,机器学习平台实际上是百度提供的托管服务。
机器学习平台
在这个机器学习平台上,百度将数据训练的流程打通,与天算平台(智能大数据平台)进行了一个深度的集成。
此外,这个平台内置了二十多种常用的机器学习算法,支持业界标准Spark MLlib,同时也对应了百度内部的海量数据和常用模板。
但使用这个平台需要用户提供自己的数据。刘炀解释,如果是一秒钟就要解决的事情,用户可以通过感知平台来解决。但如果需要基于大量重复发生的数据进行预测,百度的机器学习平台则非常适合这样的场景。
刘炀举了一个例子,如果你在物流领域掌握大量数据,就可以预测下一次从A地到B地哪一条路最短最方便,这是适合机器学习平台去解决的问题。
所以,可以使用机器学习平台的用户必须本身就掌握了大量行业数据。
第三个平台是深度学习平台。百度在今年9月已经对深度学习框架进行开源。而今天,作为百度内部大量数据系统组成的深度学习平台,PaddlePaddle在今天也正式对全球开发者进行开放。
深度学习平台
据刘炀介绍,这平台拥有大量神经网络算法,运行十分高效灵活。如果用户对小规模数据进行研究,可以单机进行;但如果数据量达到一定规模,基于一个分布式系统就可以运行并建立模型;如果数据量非常庞大,则需要有CPU的集群来进行学习。
那么深度学习平台适合于什么样的用户?其目标用户群体肯定比感知平台及机器学习平台的用户群要窄,它更适合于数据科学家以及专业级别非常高的工程师,因为用户必须对数据模型运作有深刻的理解才能使用这个数据学习平台。
但当前的“天智”仅仅初级1.0版本,也就是说,百度的人工智能云平台未来还有很长的路要走。
目前,百度在机器学习领域的发展其实还处于“感知”阶段,对于“认知”等需要靠深度学习才能解决的问题,百度的水平其实还没有达到一定的高度。