\n开发者的好消息:Twitter刚刚在\n博客上宣布将在9月19日的Strange Loop大会上公布Storm的代码。这个类似于Hadoop的即时数据处理工具是\nBackType开发的,后来被Twitter收购用于Twitter。Twitter列举了Storm的三大类应用:\n**信息流处理{Stream pro
作者:吴嘉川、刘佳昕网页、PDF里的数据获取,令人头大;更别提数据清理了。在大多数情况下,做数据可视化的我们都难以得到最干净整洁全面的“ready to go”的数据,需要我们在网页中去“挖”,再去另外的平台进行“清理”,下面就介绍一些NICAR中被提到的常用工具。01 网页获取数据-非编程方式
A.