谁在用 Hadoop?这是个问题。在大数据背景下,Apache Hadoop 已经逐渐成为一种标签性,业界对于这一开源分布式
技术
的了解也在不断加深。但谁才是 Hadoop 的最大用户呢?首先想到的当然是它的“发源地”,像 Google 这样的大型互联网搜索引擎,以及 Yahoo 专门的广告
分析
系统。也许你会认为,Hadoop平台发挥作用的领域是互联网行业,用来改善分析性能并提高扩展性。其实 Hadoop 的应用场景远不止这一点,深入挖掘的话你会发现 Hadoop 能够在许多地方发挥巨大的作用。
美国著名科技博客 GigaOM 的专栏作家 Derrick Harris 跟踪云计算和 Hadoop 技术已有多年时间,他也在最近的一篇文章中总结了 10 个 Hadoop 的应用场景,下面分享给大家:
- 在线旅游:你知道吗,目前全球范围内 80%的在线旅游网站都是在使用 Cloudera 公司提供的 Hadoop发行版,其中 SearchBI 网站曾经报道过的 Expedia 也在其中。
-
移动
数据:Cloudera
运营
总监称,美国有 70%的智能手机数据服务背后都是由 Hadoop 来支撑的,也就是说,包括数据的存储以及无线运营商的数据处理等,都是在利用 Hadoop 技术。
- 电子商务:这一场景应该是非常确定的,eBay 就是最大的实践者之一。国内的电商在 Hadoop 技术上也是储备颇为雄厚的。
- 能源开采:美国 Chevron 公司是全美第二大石油公司,他们的 IT 部门主管介绍了 Chevron 使用Hadoop 的经验,他们利用 Hadoop 进行数据的收集和处理,其中这些数据是海洋的地震数据,以便于他们找到油矿的位置。
- 节能:另外一家能源服务商 Opower 也在使用 Hadoop,为消费者提供节约电费的服务,其中对用户电费单进行了预测分析。
- 基础架构管理:这是一个非常基础的应用场景,用户可以用 Hadoop 从服务器、交换机以及其他的设备中收集并分析数据。
-
图像处理:
创业
公司 Skybox Imaging 使用 Hadoop 来存储并处理图片数据,从卫星中拍摄的高清图像中探测地理变化。
-
诈骗检测:这个场景用户接触的比较少,一般
金融
服务或者政府机构会用到。利用 Hadoop 来存储所有的客户交易数据,包括一些非结构化的数据,能够帮助机构发现客户的异常
活动
,预防欺诈行为。
-
IT
安全
:除企业 IT 基础机构的管理之外,Hadoop 还可以用来处理机器生成数据以便甄别来自恶意软件或者网络中的攻击。
- 医疗保健:医疗行业也会用到 Hadoop,像 IBM 的 Watson 就会使用 Hadoop 集群作为其服务的基础,包括语义分析等高级分析技术等。医疗机构可以利用语义分析为患者提供医护人员,并协助医生更好地为患者进行诊断。
|