Twitter即将开源即时数据处理工具Storm
\n开发者的好消息:Twitter刚刚在
\n博客上宣布将在9月19日的Strange Loop大会上公布Storm的代码。这个类似于Hadoop的即时数据处理工具是
\nBackType开发的,后来被Twitter收购用于Twitter。
Twitter列举了Storm的三大类应用:
\n**信息流处理{Stream processing}*
\n
\n: Storm可用来实时处理新数据和更新数据库,兼具容错性和可扩展性。
**连续计算{Continuous computation}*
\n: Storm可进行连续查询并把结果即时反馈给客户端。比如把Twitter上的热门话题发送到浏览器中。
**分布式远程程序调用{Distributed RPC}*
\n: Storm可用来并行处理密集查询。Storm的拓扑结构是一个等待调用信息的分布函数,当它收到一条调用信息后,会对查询进行计算,并返回查询结果。
目前即时数据处理工具已经不少了,比如
\nHStreaming(使用Hadoop),开源的
\nS4和
\nStreamBase,人们还需要一个开源的Storm吗?