作者:Vik ParuchuriPython 的科学栈相当成熟,各种应用场景都有相关的模块,包括机器学习和数据分析。数据可视化是发现数据和展示结果的重要一环,只不过过去以来,相对于 R 这样的工具,发展还是落后一些。幸运的是,过去几年出现了很多新的Python数据可视化库,弥补了一些这方面的差距。matplotlib
概述在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data Building),也就是B型数据科学。从工具上来看,按由业务到工程的顺序,这个两条是:EXCEL >> R