这里是作者的英文版github地址
可以直接购买英文版:Buy the book on Amazon
2017第二版主要更新:
- 所有代码,包括Python教程,都升级到了Python3.6(第一版用的是Python2.7)
- 更新了Python的安装介绍。这次改用Anaconda Python发行版,以及其他一些需要的Python包
- 使用了最新的2017版pandas
- 新增了一章,用来介绍pandas的高级应用工具,和其他一些有用的小贴士
- 简单介绍了如何使用statsmodels和scikit-learn
作者Wes McKinney是pandas的创作者,所以说,还有什么比作者本人来直接告诉你pandas哪些用法更实用的呢:)另外已经联系过了Wes本人,这个笔记不会有任何版权问题,当然,也不会用于任何商业用途。
这本书自2013年第一版发行后,就广受好评。最近打算把这本书完整过一遍,顺便通过jupyter记录下笔记分享给大家。
我在做第一版第三章的笔记时,才发现作者已经在2017年推出了第二版,不过暂时还没有中文版。所以这里我打算直接把书里的内容翻译成中文,做一个简洁版的Notebook版本。
第一版的时候作者用的是Python2,不过随着Python2的维护年限将近(2020),以及Python3的推广,整个社群向Python3转变已经成为不可扭转的趋势。 所以在第二版里,作者使用了Python3.6。而我实际写的代码则是基于Python3.5,使用上没有任何差别。
在写笔记的时候,我尽量写中文,不过有一些专有名字我是直接写英文,然后配上中文翻译,毕竟有时候知道英文单词的话查找英文的文档也方便一些,而且我相信这样做对提升中文和英文专业名字的对照关系有帮助。毕竟在程序员的世界里,不懂英语会很艰难,即使是一些简单的单词,也是我们走向新世界的起点。
另外我并不是逐字逐句翻译,因为这样翻译出来的结果就是洋味十足,看不懂。我尽量按方便理解的方式进行翻译,其他一些没有用的话我不进行翻译,就像上面说的,这是一个简洁版的笔记,只翻译书中有用的东西。
如果觉得有帮助的话,就点个Star吧:)
-
Chapter 3: Built-in Data Structures, Functions, and Files (内建数据结构,函数和文件)
-
Chapter 4: NumPy Basics: Arrays and Vectorized Computation(NumPy基础:数组和向量化计算)
- 4.1 The NumPy ndarray: A Multidimensional Array Object(ndarray: 多维数组对象)
- 4.2 Universal Functions: Fast Element-Wise Array Functions(通用函数:快速点对点数组函数)
- 4.3 Array-Oriented Programming with Arrays(数组导向编程)
- 4.4 File Input and Output with Arrays(通过数组来进行文件的输入和输出)
- 4.5 Linear Algebra (线性代数)
- 4.6 Pseudorandom Number Generation(伪随机数生成)
- 4.7 Example Random Walks(一个例子:随机漫步)
-
Chapter 6: Data Loading, Storage, and File Formats(数据加载,存储,文件格式)
The code in this repository, including all code samples in the notebooks listed above, is released under the MIT license. Read more at the Open Source Initiative.