李彦宏展示“百度大脑”:互联网的下一幕是人工智能
i黑马 讯 9月1日消息 今日,2016年百度世界大会举行。百度创始人、董事长兼首席执行官李彦宏在会上表示,移动互联网利用人口红利带来的增长已经逐渐见顶,互联网正在进下一幕人工智能时代。
会上,百度首次向外界全面展示了百度人工智能成果——“百度大脑”。李彦宏介绍,百度大脑已建成超大规模的神经网络,拥有万亿级的参数、千亿样本、千亿特征训练,能模拟人脑的工作机制。相比三年前2-3岁孩子的智力水平,百度大脑如今智商已有了超前发展,在一些能力上甚至超越了人类。
李彦宏详细阐释了百度大脑在语音、图像、自然语言处理和用户画像领域的进展。目前,百度大脑语音合成日请求量2.5亿,语音识别率达97%。现场,他展示了利用百度大脑合成的张国荣声音,能够实现与粉丝”隔空对话”。
李彦宏称,在图像能力方面,百度大脑人脸识别准确率达到99.7%。百度无人车刷新了KITTI测试的多个世界记录——在KITTI竞争最激烈的车辆检测评比中排名第一。在自然语言处理方面,度秘能够与知名体育评论员杨毅同台解说。在用户画像领域,百度大脑拥有千万级别的用户标签体系,实现“通用与垂直领域”相结合。
i黑马了解到,接下来,百度大脑将与各行各业合作,衍生出不同领域的行业大脑,如医疗大脑、交通大脑、金融大脑。目前,百度大脑已经与不同领域发生了碰撞。
例如,欧莱雅将百度AR技术应用于品牌营销;《魔兽》出品方传奇影业利用百度的用户画像能力提升票房。
当天,英伟达公司联合创始人兼首席执行官黄仁勋也发表了主题演讲,并与百度联合宣布将继续在无人驾驶汽车领域深化合作,汇聚百度云平台、地图技术和NVIDIA汽车人工智能计算平台,创建从云服务到汽车自动驾驶的平台。
以下为李彦宏演讲实录(经i黑马删减):
当中国的7亿网民都用上智能手机,互联网的发展已经不能靠人口红利来驱动了。当前,中国进入到经济的新常态,国家也提倡互联网+,实际上是希望我们用互联网的效率来推动行业的发展。整个中国的经济增长需要依靠互联网,但是互联网的增长却遇到了瓶颈,过去粗放式的野蛮增长没有了。
互联网的下一幕,就是人工智能。过去五六年,百度对人工智能的技术投入非常大。人工智能对百度意味着什么?就是“百度大脑”。三年前,百度就讲过“百度大脑”这个概念。那个时候的百度大脑已经具备了大概两三岁孩子的智力水平。
今天的百度大脑相当于多少岁的人脑呢?回答这个问题还蛮难的。百度大脑和人脑的正常发育过程很不一样。百度大脑包括三个部分:
1)计算方法。包括超大规模的神经网络、万亿级的参数、千亿样本和千亿特征训练;
2)计算能力。包括数十万台服务器构成了“百度大脑”的实体,几年前百度便开始自建中国最大的GPU集群;
3)数据。全网的网页数据、十多年来累积的搜索数据,以及百亿级的图像、视频、定位数据。
百度大脑的语音识别能力如何?百度大脑的语音识别现在已经到了第二代,使用深度学习的技术进行语音识别。百度语音识别的准确率能够达到97%,已经超过了人对语音的识别能力。
这样的能力到底可以在什么地方帮助到我们?例如,通过百度语音识别能力,一个新的销售上岗的第一天,就可能掌握他所获得的那些最优秀的销售的能力:新销售打电话给潜在客户的时候,客户每说一句话,客户每问一个问题,百度大脑都实时地识别了它的问题,并且显示在销售的电脑的屏幕上,屏幕上不仅实时展示了客户的问题,而且实时地把最优秀的销售是怎么回答这个客户的问题也展示在这个屏幕上。
百度大脑的能力主要有四个方面,它们最能够突出表现当今世界人工智能最热、最核心、最强大的能力:
第一,语音的能力。包括语音识别能力和语音合成能力。
第二,图像的能力。图像能力指的是看到一个图片,不仅能看得见,还能看得懂。按照技术界的说法,它应该是计算机视觉。
第三,自然语言处理能力。自然语言处理能力比语音和图像更难。语音和图像技术更多还处在认知的阶段,而自然语言理解除了要有认知能力之外,还需要逻辑推理能力、规划能力等等,同时也需要依赖于更为强大的知识图谱。
第四,用户画像。用户画像在传统的AI中并不是主流。但是今天,我们每时每刻都可以收集很多很多和用户行为相关的数据,就可以对用户做很好的画像,而这里面使用的技术又基本上都是与人工智能相关的。
百度大脑的另一种语音能力——语音合成。
基于大数据与深度学习技术优势,百度的新型情感语音合成系统能够让机器摆脱平铺直叙的发声,为用户带来更自然、更接近真人朗读的听觉体验。目前,百度每天响应的语音合成的请求达到了2.5亿次。
在情感语音合成技术上线后,用语音听小说的百度用户从过去平均每天听0.69小时,增长到现在的2.21小时。语音合成的能力对用户的App使用黏性的提升是非常显著的。