阿里的人工智能之路,他和谷歌亚马逊有多大差距
(原标题:Inside the Chinese lab that plans to rewire the world with AI)
(图示:杭州阿里巴巴总部)
上海地铁站的自动售票机有着自己的独特之处。走到一台机器前,说出你要去的地方,它会自动为你推荐路线,然后发出一张相应的地铁票。这台售票机还会通过人脸识别查验你的身份。此外,为了减少地铁高峰期的操作时间,系统设置成无需操作按钮,而是通过语音即可完成车票购买。
更令人印象深刻的是,所有这一切都发生在一个拥挤嘈杂的车站里。每台售票机必须辨别出谁在说话,在人群中提取出购票者的声音,进行转录并解析它的意思,同时还要在几秒钟内通过面部识别系统将用户面部与海量数据库进行比对。
为了做到这一点,售票机使用了几种尖端机器学习算法。然而,真正有趣的事情不是算法本身,而是它们背后的地方。所有这些图像处理和语音识别功能都是中国电子商务巨头阿里巴巴拥有的云计算系统提供的。
阿里巴巴已经在使用人工智能和机器学习来优化其供应链,为消费者进行个性化推荐,并构建类似于亚马逊Echo的智能音箱设备天猫精灵(Tmall Genie)等产品。中国的另外两家科技巨头腾讯和百度也在人工智能领域投入巨额资金。中国政府计划在2030年之前打造一个价值约1500亿美元的人工智能产业,并激励国内研究人员能够主导这一领域。
但阿里巴巴的目标是成为基于云的人工智能行业领导者。像云存储(诸如Dropbox)或云计算(Amazon Web Services)一样,基于云的人工智能将以低廉的价格为任何拥有计算机和互联网连接的人提供强大的资源,使新型业务得以发展。
这样一来,中国和美国之间人工智能的真正竞争将成为两国大型云公司之间的竞争,它们将力争成为那些要利用人工智能的公司或城市的服务提供商。而且除了阿里巴巴之外,中国的科技巨头已经准备好与谷歌,亚马逊,IBM和微软在人工智能服务市场进行竞争。无疑,在这个行业中占主导地位的公司将在人工智能开发和使用方式有强大的话语权。
构想更大
1999年,马云在杭州的公寓里创建了阿里巴巴,当时这只是一个简单的电子商务平台。今天阿里巴巴公司总部由数幢大型建筑组成,数万名员工在内办公。总部正门是阿里巴巴的橙色卡通吉祥物。
目前阿里巴巴的核心业务仍然是销售商品,并为企业与企业之间的贸易提供平台。但是这已经催生了其他利润丰厚的业务,其中包括物流、发货平台、广告营销网络、云计算以及金融服务。公司无处不在的移动支付应用程序支付宝由姊妹公司蚂蚁金服运营。除支付宝外,蚂蚁金服还有贷款,保险和智能手机投资业务。
去年11月11日在,阿里巴巴的“光棍节”当天该公司商品销量超过250亿美元。相比之下,在去年全美最大的在线购物日网络星期一(11月27日),所有零售商的总销量也只有65.9亿美元。
该公司的成功也让杭州成为了一个充满活力的科技城市。现在的杭州市拥有数十个孵化器,部分由政府补贴资助,其中很多企业都是在阿里巴巴工作过的员工这些孵化器中充满了曾在阿里巴巴工作过的企业家。
而阿里巴巴的创始人显然不认为这是理所当然的。“马云认为,我们之所以的成功是因为良好的商业模式、勤勉的团队加上运营,”公司技术开发总监刘翔文(音译)说。“但在公司激烈竞争的下一个时代,马云认为单纯依赖商业模式不能为像阿里巴巴这样的巨人带来成功。他的信念是技术。”
去年10月,马云宣布,公司将在未来三年内为旗下名为达摩院的研究机构开支150亿美元。该研究所名字中的达摩是佛教传说中的印度高僧,在公元五世纪将佛教带到了中国。
中国科技公司早已经摆脱了模仿西方创新的论断。根据经济合作与发展组织(OECD)的数据,2000年至2016年期间中国科技研发支出增长了10倍,从408亿美元增加到现在的4120亿美元。2016年美国研发支出达到了4640多亿美元,但自2000年以来,美国研发支出仅增长了三分之一。
阿里巴巴已经是中国最大的研发中心,2017年的研发支出为26亿美元。未来达摩院会将其研究预算增加三倍,达到70亿美元以上。这很可能意味着阿里巴巴将超越IBM,Facebook和福特,并缩小与全球领先企业亚马逊和Alphabet在研发投入上的差距。2017年,亚马逊和Alphabet研发方面分别支出161亿美元和139亿美元。
达摩院旗下涵盖了一批从事区块链,计算机安全,金融科技和量子计算等基础和新兴技术的研究团队。但人工智能是其中的重中之重,而且似乎是最有潜力的。
达摩院显然是从20世纪那些伟大的商业研究实验室获得了启发。刘提到了AT&T的贝尔实验室,其进行材料,电子和软件方面的基础性研究,从而发明了包括晶体管,激光,数字成像电荷耦合器件等硬件以及UNIX操作系统和编程语言C、C ++等软件应用。刘说,阿里巴巴也受到美国国防部高级研究计划局(DARPA)资助不同团队参与同一项目这种方式的启发。
阿里巴巴显然也是在向Alphabet和亚马逊这样的公司学习。像这些公司一样,它已经发布了一个云计算机学习平台。这也是第一个由中国公司发布的云计算学习平台,于2015年上线,去年进行了大规模升级。其提供的工具类似于Google Cloud和Amazon Web Services,囊括了诸如语音识别和图像分类之类的解决方案。
开发这些工具是阿里巴巴的一项重大技术任务,这标志着公司对于人工智能的雄心壮志以及云计算将在其中发挥多大作用。
另一个信号是,阿里云开始支持其他几家公司的深度学习框架,其中还包括谷歌的TensorFlow和亚马逊的MXNet。深度学习是一种通过将大量数据输入到多层神经网络中,从而训练机器识别事物的技术。其也是人工智能领域中最重要的方法,可用于自动驾驶车辆、语音转录等多个方面。科技公司之所以要花大力气构建自己的深度学习框架,部分是为了吸引用户进入他们的云平台,因为这些框架通常在其基础架构上运行得最好。通过支持其竞争对手的框架,阿里巴巴为开发者提供了使用其平台的更多理由。
这还不是全部:刘暗示阿里巴巴正在研究自己的深度学习框架,这可能会让更多的工程师着迷于云计算。当被问及阿里巴巴是否会发布其开发的一些代码时,她回答道:“当它成熟的时候会的。”
聪明答案
最近阿里巴巴在人工智能方面取得了不少进展。上个月,该公司的一个研究小组发布了一个人工智能程序,该程序能够阅读一段文字,并且回答关于这段文字的简单问题,要比以往任何版本都更准确。
需要注意的是,这段文字是英文而非中文。因为该程序是在斯坦福问题答疑数据集(SQUAD)上进行的,后者是一个用于测试计算机化问答系统的标准数据集。阿里巴巴的项目应用了几种新颖的机器学习技术,其得分要比微软,三星等公司更高。值得注意的是,它要高于比一般人的得分(虽然这有点欺骗性,但并不意味着该计划真正理解了它正在阅读的内容)。
不过更值得注意的是,阿里巴巴在人工智能领域前进的速度令人咂舌。该公司在2017年9月才提交了第一次参加SQuAD竞赛的申请。“前十名团队中有不少是中国顶级科研机构,反映了人工智能领域的竞争白热化,”负责SQuAD竞赛的斯坦福大学博士生Pranav Samir Rajpurkar表示。
该团队的一名成员表示,阿里巴巴已经利用该项目来改进其在线市场上的自动客户服务。阿里巴巴希望在其平台和更多应用上部署最新的语言理解技术。
阿里巴巴的人工智能研究人员还正在研究其他尖端项目,例如生成对抗网络,也就是GAN。由谷歌研究人员开发的这种令人兴奋的新型机器学习方法中,两个神经网络彼此对抗;其中一个试图声称看起来好像来自真实环境的数据,而另一个试图区分出真假。这项技术可以让计算机从未标记的数据中更高效地学习,也可以用来创建逼真的合成图像和视频。
收集云数据
相比于西方世界同行,中国科技公司的一个显著优势是政府支持。使用上海地铁站人工智能技术的智能城市很可能会成为中国的未来。阿里巴巴的云人工智能工具之一是名为城市大脑City Brain的套件,专门用于管理交通数据和分析城市监控视频。
在西方世界也有这样的实验,比如Alphabet旗下的Sidewalk项目,该项目计划用自动驾驶汽车,投递机器人以及基于人工智能的管理系统改造多伦多郊区。但是中国在人工智能开发方面的规模更大,这将使国内科技公司在全球人工智能领域中占有更多优势。
得益于庞大的人口基数,中国科技企业的另一个优势是可以获得大量数据。举例来说,蚂蚁金服运营的支付宝拥有超过5.2亿的用户,公司能够通过用户日常的金融交易和社交关系来确定其信誉度。
现在,阿里巴巴已经在出口自家的人工智能技术。作为仅次于亚马逊,谷歌,微软和IBM的全球第五大云计算提供商,阿里巴巴的云计算机器学习平台有多种语言版本,其中也包括英文版。本周,阿里巴巴推出了面向欧洲开发商和公司的新版本;它还与新加坡南洋理工大学合作成立了一个新的人工智能实验室。
在某些方面阿里巴巴可以说已经领先于竞争对手。去年12月,它宣布与马来西亚政府合作提供智能城市服务,其中包括可自动检测事故并帮助优化交通流量的视频平台。
随着中国的科技巨头更加精通人工智能,其将有助于确定这项技术会如何改变世界。而阿里巴巴无疑将成为未来的重要组成部分。
哈佛商学院(Harvard Business School)中国问题专家威廉・柯比(William Kirby)表示:“在商业环境中,阿里巴巴是一个使用人工智能的重要创新者。在我看来,阿里巴巴在改变中国业务方式方面已经做了很多;他们在每个领域都雄心勃勃。“(晗冰)