亚马逊、微软、谷歌 三大云计算供应商的大数据服务比较
大数据服务对于企业云来说颇具吸引力,亚马逊AWS,微软Azure和谷歌公共云为此在市场中激烈竞争,但哪家公司会脱颖而出呢?
云计算的市场正在迅速发展,而大数据业务也在不断变化。虽然这对于云计算供应商来说比较困难,这是值得尝试的,而这对于全球领先三大云计算供应商(亚马逊网络服务,微软Azure和谷歌公共云)来说也是不平等的。
在云计算和大数据具有协同效应的市场区域,谷歌公司在搜索方面经验非常丰富有但亚马逊网络服务(AWS)和微软Azure吸引一些有趣的初创公司增加价值。
亚马逊网络服务(AWS)拥有广泛的大数据服务。例如亚马逊弹性MapReduce,运行Hadoop和Spark而KinesisFirehose和KinesisStreams提供了大数据集到AWS。用户可以通过Redshift存储数据,Redshift是通过数据压缩以帮助降低成本PB级规模的数据仓库,开源软件Elasticsearch是部署在AWS中的分析工具,提供如点击率和日志监控等服务。并通过Kinesis补充分析数据流。
值得一提的是,谷歌提供的大数据产品缺乏的就是GPU实例。
与谷歌公司相比,AWS有一个更大的数据集的存储选择。除了大量的AWS简单存储服务的农场以外,还拥有低延迟的NoSQL数据库;为Titan图形数据库提供存储服务的DynamoDBTitan;PB级的NoSQL数据库和关系数据库ApacheHBase。
AWS还具有一个商务智能(BI)服务,QuickSight可以采用并行的方式,在内存中实现高速处理。这是亚马逊机器学习和物联网的AWS联网(IoT)平台,该平台的设备连接到云中,并可以扩展到数十亿美元的设备和万亿条消息。
对于分析,微软Azure有数据分析湖,它采用专有的U-SQL与SQL和C++,以及基于Hadoop的服务的HDInsight。此外,还有Azure的分析数据服务DataFactory,使用全局元数据系统识别数据资产和数据工厂,其中连锁内部部署和云数据源和管理数据管道。
数据存储湖是Azure在Hadoop文件系统的大数据存储服务。云服务提供商有广泛的通用存储产品,包括StorSimple,SQL和NoSQL数据库和存储块。
谷歌公司的BigQuery资料服务使用一个类似SQL的界面,对于大多数用户来说很直观,甚至非技术的学习。它支持PB级的数据库,并可以执行每秒100,000行的数据流,以替代从云存储数据的运行。BigQuery同时支持地理复制,并且用户可以选择他们自己的存储数据。
BigQuery是一个没有一个专门的基础设施的即收即付的服务,允许谷歌使用了大量的处理器来维持快速查询次数。也支持park,Hadoop,Pig和Hive集成。企业也可以使用谷歌Analytics(分析)和DoubleClick。谷歌云数据流允许用户进行云数据服务排序。
谷歌提供其他的大数据服务,其中包括非关系型数据的NoSQL数据库CloudDatastore;可大规模扩展的NoSQL数据库CloudBigTable;机器学习的云管理平台CloudMachine;以及一些辅助工具,如翻译和语音转换器。
在许多方面,三大云计算供应商在大数据服务方面步调一致,虽然在性能和使用需要一些实际的测试来辨别之间的差异。虽然谷歌可能具有搜索的优势,但落后于BI前端,微软公司有Cortana优势。谷歌缺乏GPU实例也是一个显著的差异。
内容来源:36大数据