Python数据科学手册推荐!
Python语言拥有一个庞大的程序库,可以用来存储、操作和洞察数据,它已经成为数据科学研究人员非常尊敬的工具。这本书基于IPython、NumPy、Pandas、Matplotlib和Scikit--学习,它们可以完成数据科学的大部分工作。从实际的角度来看,它教会了如何清理和可视化数据,如何使用数据建立各种统计或机器学习模型以及其他常见的数据科学任务,以便使各个领域的工作人员和数据处理人员能够发现和解决问题。
这本书是一本以数据深度要求以及计算和统计方法为中心的科学和研究参考书。这本书有五个章节,每一章都介绍了Python数据科学中的一个或两个关键工具包。从IPython和木星开始,它们提供了数据科学家需要的计算环境;第二章解释了提供ndarray对象的NumPy可以使用Python有效地存储和操作大型数组;第三章主要讨论Pandas,它提供DataFrame对象,可以使用Python高效地存储和操作标记的/列数据;第四章是关于Matplotlib的,它为Python提供了许多数据可视化功能。第五章基于Scikit-Learning,它为最重要的机器学习算法提供了一个高效、整洁的Python版本实现。
本书适用于具有编程背景的数据科学研究人员,并打算使用开源Python工具作为分析、操作、可视化和学习数据。
作者简介
JakeVanderPlas,Python科学堆栈深度用户和开发人员,特别是擅长Python科学计算和数据可视化的开发人员,是诸如Altair等可视化图书馆的创建者,并为Scikit--学习、IPython和其他Python图书馆做出了许多贡献。他目前是美国华盛顿大学电子科学学院物理科学研究所院长。