第三章--内建数据结构、函数及文件
第四章--Numpy基础:数组与向量化计算
第五章--Pandas入门
第六章--数据载入、存储及文件格式
第七章--数据清洗与准备
第八章--数据规整:聚合、合并和重塑
第九章--绘图和可视化
第十章--数据聚合与分组运算
第十一章--时间序列
第十二章--pandas高级应用
第十三章--Python建模库介绍
第十四章--数据分析案例
作者Wes McKinney是pandas的创作者,所以书中关于pandas的讲解也是最实用的部分。
这本书自2013年第一版发行后,就广受好评。第一版的时候作者用的是Python2,不过随着Python2的维护年限将近(2020),以及Python3的推广,整个社群向Python3转变已经成为不可扭转的趋势。所以在第二版里,作者使用了Python3.6。而我实际写的代码则是基于Python3.5,使用上几乎没有任何差别。
第二版主要的更新:
- 所有代码,包括Python教程,都升级到了Python3.6(第一版用的是Python2.7)
- 更新了Python的安装介绍。这次改用Anaconda Python发行版,以及其他一些需要的Python包
- 使用了最新的2017版pandas
- 新增了一章,用来介绍pandas的高级应用工具,和其他一些有用的小贴士
- 简单介绍了如何使用statsmodels和scikit-learn
可以通过本书的GitHub仓库获得本书的每一章的数据文件和相关材料。GitHub仓库地址请点击这里
第一次完整的重现了书中的所有代码,感觉这是一本非常非常好的书,值的一读再读。 最后为大家推荐一首歌非常非常好听,李千娜演唱的延禧攻略片尾曲雪落下的声音
