BAT是如何布局人工智能领域的?
文 / 李娜,王云辉,作者微信公众号:科技杂谈(keji_zatan)
连胜中国顶级棋手60盘之后,Master亮出真身,果然是曾经击败李世石的谷歌人工智能AlphaGo。
这既是炫技,也是完美的品牌策划。两次围棋决胜之后,AlphaGo已隐然成为人工智能的代名词。
但人工智能的世界里,远不止有谷歌。
如果我们回转目光,中国的人工智能在哪里?
我们且来看看作为中国互联网扛旗的BAT,它们在人工智能领域的布局与落子。
【百度】
之所以把百度放到最前,是因为在人工智能领域,百度是BAT之中最为重视,布局发展最早,今年发展也极为迅猛的。
此前,百度董事长李彦宏就曾在公共场合反复强调,互联网即将迎来发展的下一幕,而推动其发展的核心动力,不是大数据,也不是云计算,而是人工智能。
这句话并不只是口号。对于百度来说,人工智能正是其向上突破的关键机会。
当然,在百度布局人工智能市场的早期,这一大举投入还更多被外界看作一个概念秀,或是一场激进冒险。毕竟,人工智能何时会爆发,何时才能实现产品化,都还要打一个大大的问号。
但如今,百度在人工智能领域的投入与布局,逐渐显现成果。
2016年2月,《麻省理工评论》将语音接口列为2016年十大突破技术,百度硅谷人工智能实验室(SVAIL)最新的研究成果--新一代深度语音识别系统Deep Speech2位列其中;6月,《麻省理工科技评论》评选的"全球最聪明的50家公司",百度成功入选; 11月,百度大脑入选15项世界互联网领先科技成果,百度无人车首次驶上城市开放道路。
在这背后,百度在人工智能领域的布局轮廓,也已日趋明朗。
一、百度大脑
2016年9月1日召开的百度世界大会上,百度首次向外界全面展示百度人工智能成果--"百度大脑"。它由超大规模的神经网络、计算、数据组成,可以用技术模拟人脑思维,达到大约相当2~3岁儿童的智力水平。
百度大脑的三大核心技术,分别是PaddlePaddle深度学习平台(算法模型)、AI超级计算机(底层技术)、大数据。
其中,Paddle,Parallel Distributed Deep Learning(并行分布深度学习),是百度研发的深度学习内部平台,同时也是百度大脑的算法模型。已实现CPU/GPU单机和分布式模式,同时支持海量数据训练、数百台机器并行运算,提供了Neural Machine Translation、推荐、图像分类、情感分析、Semantic Role Labelling等5个Task,具有易用,高效,灵活和可伸缩等特点。
百度的AI超级计算机,是专门基于人工智能的应用定制的,国内最早的超高速异构计算集群,融合了百度自主研发高密度的异构计算服务器,GPU Box、FPGA等,是构成百度大脑的核心基础之一,在相关技术领域累计专利超过60项。
对深度学习来说,人工智能的成长高度依赖于海量大数据的训练,在这方面,百度的积累包括全网万亿级网页、数十亿级搜索数据、百万级图像视频数据、百万级定位数据。
百度大脑主要包含:语音、图像、自然语言处理、用户画像四大能力。
1、语音能力
作为中国最大的搜索引擎,百度累积了最大规模的的中文语音数据。百度将这些数据注入其最新的语音识别引擎DeepSpeech2。如今,百度语音识别的准确率已达97%。
语音合成技术:运用最新的深度学习算法,只需要按照要求说50句话,便可以让每个人拥有自己的声音模型,而且语音合成效果和真人一样自然逼真并且情感丰富。目前,百度语音合成技术已应用到百度各个产品中,每天响应的语音合成请求量达到2.5亿次,以手机百度小说频道为例,听小说的用户从过去听40分钟,增长到现在的近两个半小时。
2、图像识别
目前,百度的人脸识别准确率已达到99.7%,可识别人脸上的72个特征点,并将这些特征点连结起来形成面部表情网,可据此识别每个人的各种表情。
其OCR识别技术也可自动进行目标识别,实现百度地图中的POI、导航等信息的快速更新。此前,在国际文档分析与识别大会(ICDAR)最具挑战性的自然场景类文字识别任务中,百度OCR技术已斩获五项冠军。
3、自然语言处理能力
可以对人类自然语言进行分析、理解、生成、翻译,实现自然的人机对话交互。目前,嵌入自然语言处理技术的百度机器翻译,已支持27种语言互译,702个翻译方向。
4、用户画像能力
百度系产品的10亿日活量,已经被划分为千万级细分标签的大数据。目前,百度的用户画像分为两个维度,垂直画像支持金融、保险、生活服务、零售、旅游、房产、咨询等深度行业应用,通用画像则基于人口属性、位置属性、长期兴趣、短期意图、APP偏好等描绘用户画像,支持全行业个性化应用。
二、无人车驾驶
在无人驾驶方面,今年乌镇世界互联网大会,百度的无人车已经实现国内首次在全开放城市道路的复杂路况下,全程无人工干预的L4级别的全自动驾驶。
拥有环境感知、行为预测、规划控制、操作系统、智能互联、车载硬件、人机交互、高精定位、高精地图和系统安全等十项核心技术。截止到2016年11月底,百度在自动驾驶领域全球发明专利申请量已达609项。
百度与无人汽车相配套的人工智能技术,还包括,:
(1)3D高精地图:可达到厘米级的精度,精细到路面行车线、可以分辨桥上、桥下,摄像头、路牌、斑马线等。
(2)智能感知:可通过 64线激光雷达、高动态范围相机模组、毫米波雷达、GPS/ IMU组合导航定位系统等等技术,通过计算机视觉分析,深度理解车辆周围的环境信息。此前在国际通用车辆检测KITTI数据集车辆检测中,准确率达92.65%,居世界第一。
(3)车载计算中心:完全自主研发的车载计算中心,使用CPU+GPU(图形处理器Graphics Processing Unit)+FPGA异构计算平台,可完成百度计算大脑感知、决策、规划、控制等全部计算。计算能力远超传统汽车,并已在一年内提升8倍,紧急状况处置时间比人类快3倍。
(4)汽车大脑:无人车最核心的部分,是百度自主研发的汽车大脑,基于高精地图和智能感知进行智能控制。它能根据实时感知到的环境信息、高精地图数据,实现对于路径的最优规划,通过预测车辆、行人的行为和意图,做出合适路况的行车决策,从而控制无人车正常行驶。
三、度秘。
度秘集百度积累多年的语音识别、图像识别、自然语言理解等众多先进技术于一身,通过KFC机器人员工、高考志愿填报小秘书、奥运篮球解说员等真实的用户服务场景,积累数据并不断训练人工智能"大脑"。
四、百度AR
百度AR由图像识别、三维感知与跟踪、人机交互、三维渲染与虚实融合四大技术组成。利用百度大脑的技术和计算能力,百度AR正在物体识别、三维环境感知、人机交互等核心方向建立领先优势。
百度AR研究的核心技术包括:图像识别与追踪、视觉同时定位与建图(SLAM)技术、AR渲染引擎、以及传感器数据融合技术。其中,图像识别与追踪技术在iOS和Android平台上的运行时间和识别精度都处于世界领先地位。
五、百度医疗大脑
百度医疗大脑是一个人工智能助诊系统,也是百度大脑最早落地应用的大脑分支。
百度医疗大脑可以从百度亿级用户医疗健康类数据及医学论文、指南、教材中,针对900多种常见疾病进行辨别,并在线模拟医生问诊流程,与用户进行多轮交互,并从中收集、汇总、分类、整理病人的症状描述,完成与海量数据库中的样本匹配,并快速推导出使用者患有某种疾病的可能。可便捷智能地服务百姓疾病自检,并助力提升基层医生的临床诊断效率与诊断质量。
总结
可以看出,在百度的整个战略布局中,人工智能已经不再停留于研发阶段,而是逐渐深入内嵌到百度的各个产品和技术当中。
【阿里巴巴】
作为全球最大的电商平台,在阿里的战略体系之中,云计算一直都是电商、物联网的核心驱动力。
依托阿里云和电商大数据,近年来,阿里巴巴已开始在人工智能领域逐渐发力。
ET
2016年8月9日,在云栖大会北京峰会上,阿里云正式推出人工智能ET。
ET的前身,是阿里智能聊天软件小AI,在智能语音交互应用方面,阿里云ET已经基本实现了"能听、会说、懂你"式的智能人机交互体验,即识别人类的语言,并理解语境下的意思,然后做出回答。
除了视频图像识别、语音合成、交互、计算等能力,ET还已经应用到交通预测、智能客服、法庭速记、气象预测等领域。
不久前,杭州市公布杭州城市数据大脑项目,使用阿里云ET人工智能技术,对整个城市进行全局实时分析,自动调配公共资源。此外,浙江省高级人民法院宣布将在全省105家法院全面上线智能语音识别系统。承担起"书记员"的角色,能够快速、准确的完成庭审记录。
在图像和人脸识别方面,ET背后的阿里云图像识别技术采用了世界领先的深度学习技术,同时结合了其他机器学习的一些算法,使得以上功能准确度均达到95%以上。而通过高精度和高效的技术,人脸识别在LFW上识别率超过99.5%。
而在数据智能应用方面,阿里云有MaxCompute。这是是一种快速、完全托管的TB/PB级数据仓库解决方案,它为ET提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决海量数据计算问题,降低每一次运算的成本。
布局电商领域
随着阿里商业人工智能引擎"电商大脑"的不断进化,人工智能正越来越多被应用于服务业。
比如,阿里巴巴的客服需求一直伴随业务的激增而扩大,这导致人力成本高企。应对这一状况,阿里云的人工智能机器人ET介入该项服务,将语音转化为文字,再利用关键词搜索等完成质检。通过这项技术,阿里小二的工作效率提升达20倍。
阿里集团CTO张建锋表示,阿里人工智能的最大优势就是"在线+实时"。多年来不断进化的"阿里电商大脑",支持秒级别内对海量用户行为和10亿商品知识图谱进行实时分析。
比如双11全天,"电商大脑"通过机器学习,自动生成了近千亿次个性化展示,智能决策引擎分秒不停地自我迭代,每次点击背后,都有海量计算和万亿级智能匹配。
此外,阿里的"电商大脑"和"阿里小蜜"被应用的场景也很广泛。
作为阿里智能服务代表, 阿里小蜜拥有强大的语音识别、图像识别和深度学习能力,是电商领域标杆性的服务产品。在每天应对淘宝、天猫等交易平台上百万级服务量的情况下,"阿里小蜜"永远在线、全年无休,平均响应时间不到一秒,智能解决率也已超90%。也就是说,在完全无需人工介入的情况下,通过语义分析和联想计算,"阿里小蜜"能向用户提供有效、对口的服务解决方案。
未来,随着互联网成为基础设施、计算能力呈几何数爆发以及所有的线下信息孤岛被打破,人工智能将成为阿里未来30年的技术布局重点。
【腾讯】
在BAT中,腾讯的AI布局相对较晚。虽然内部很早就已经成立了AI LAB,但业务层面的驱动是近年才大规模开始,但他的投入正在持续加大。
与百度、阿里相比,腾讯在人工智能的布局相对较晚,但腾讯在大数据和用户行为积累上,拥有雄厚基础。此外,通过在全球范围内,针对人工智能公司的大规模的收购和投资,腾讯的人工智能实力也在持续提升。
2016年9月22日,腾讯宣布,正式成立腾讯AI实验室,进行AI基础理论研究及工程实现。
目前,该实验室已经有超过30位顶尖科学家入职,其中超过90%拥有博士学历。下一步,将围绕内容、社交、游戏三个领域的应用场景,专注机器学习、自然语言处理、语音识别和计算机视觉四个方面的基础研究。
下一步,腾讯还将以API形式,将人工智能工具开放给伙伴。
而在产品层面,腾讯主要围绕文本、图像、语音、视频、游戏和硬件这6类智能产品,以及智能舆情、智能医疗、智能游戏、智能音箱4条主线布局人工智能。
腾讯云
以腾讯目前的实力来看,在人工智能领域最大的底牌还是腾讯云的积累,今年5月,腾讯云在中国大数据产业峰会的展台上就展示了其人工智能、互联网金融、互联网医疗、云存储和流媒体等技术应用。
7月5日,在腾讯"云+未来"峰会上,腾讯云正式宣布将腾讯大数据能力全面开放,推出一站式数据分析与挖掘服务平台--数智方略。数智方略覆盖基础平台、通用数据应用及行业解决方案在内的40余个产品及服务。
12月26日,继宣布11个海外节点本月全量开放后,腾讯云再一次宣布在人工智能云服务领域发力,向全球企业正式提供7项AI服务。分别是:人脸检测、五官定位、人脸比对与验证、人脸检索、图片标签、身份证OCR识别、名片OCR识别(OCR即Optical Character Recognition,光学字符识别)。
据悉,在这个实验室中,他们已经有能力通过自身大数据库进行智能机器人研究,腾讯的AI技术已应用于腾讯社交、广告搜索等领域。
投资并购,多方布局
在投资层面,自2014年以来,腾讯先后投资/收购了多家人工智能产业链上的公司。其中至少包括:
ScaledInference:面向所有个人的云计算服务商
iCarbonX:定位于生命大数据、互联网和人工智能创建的数字生命生态系统研究公司
CloudMedX:医疗健康数据收集和分析服务提供商
Diffbot:通过人工智能抓取网页关键内容,并输出软件可以直接识别的结构化数据
Skymind:将深度学习整合进入Hadoop系统,帮助用户存储、处理和分析不同类型数据
目前,在基础研究领域,腾讯也结合微信、QQ、金融等主要业务优势与领域方向,配设了不同的实验室与业务团队。在服务自家业务的同时,还推出了相关领域的行业产品。旗下科研机构主要包括:
WHAT LAB:以人工智能为主要研究方向,借助大数据拓展机器学习边界。
优图实验室:专注于图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。今年6月,在国际权威人脸识别数据库LFW上,优图以99.65%的成绩刷新纪录。
微信模式识别中心:研究方向有语音识别、图像分析、语义理解、微信大数据挖掘等,其研发成果广泛应用于微信和腾讯其他产品中。
智能计算与搜索实验室:专注于搜索技术、自然语言处理、数据挖掘和人工智能四大研究领域。
【总结】
总体来看,BAT三家都已高度重视人工智能,但在战略布局与具体应用层面,则打法各有不同。
腾讯相对最为"开放",更多地采用投资与不同团队的方式,来快速完成人工智能的创新与技术累积。而应用层面,在电商、媒体、游戏等领域也相对领先。
阿里凭借着电商、支付和云服务的资源优势,人工智能目前的应用,更集中在电商领域,而阿里云的基础优势,也让其具有深厚潜力。
布局最早,技术积累也最强的百度,则更多地将人工智能转化为基础能力,植入自身的产品与业务,所以很多进展,在外部反而不易察觉,但对百度自身的产品与服务改善,却效果明显。
无论三家各自的倚重如何,在未来的中国人工智能市场领域,只有在应用中不断演进,不断地用全新的维度塑造这个领域,才能推动整个产业的前进。
【欢迎扫描微信二维码,关注科技杂谈】