《利用Python进行数据分析》.(Wes McKinney).[PDF].pdf

本书提供了一个全面的Python数据科学教程,涵盖了数据处理、分析到可视化的全过程。通过丰富的实例,读者将学会使用NumPy、pandas等库进行数据操作。


下载地址:网盘下载



内容简介  · · · · · ·

作者简介  · · · · · ·

Wes McKinney 资深数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载,是Python和开源技术社区公认的权威人物之一。开发了用于数据分析的著名开源Python库——pandas,广获用户好评。在创建Lambda Foundry(一家致力于企业数据分析的公司)之前,他曾是AQR Capital Management的定量分析师。

目录  · · · · · ·

目录
前言 1
第1章 准备工作 5
本书主要内容 5
为什么要使用Python进行数据分析 6
重要的Python库 7
安装和设置 10
社区和研讨会 16
使用本书 16
致谢 18
第2章 引言 20
来自bit.ly的1.usa.gov数据 21
MovieLens 1M数据集 29
1880—2010年间全美婴儿姓名 35
小结及展望 47
第3章 IPython:一种交互式计算和开发环境 48
IPython基础 49
内省 51
使用命令历史 60
与操作系统交互 63
软件开发工具 66
IPython HTML Notebook 75
利用IPython提高代码开发效率的几点提示 77
高级IPython功能 79
致谢 81
第4章 NumPy基础:数组和矢量计算 82
NumPy的ndarray:一种多维数组对象 83
通用函数:快速的元素级数组函数 98
利用数组进行数据处理 100
用于数组的文件输入输出 107
线性代数 109
随机数生成 111
范例:随机漫步 112
第5章 pandas入门 115
pandas的数据结构介绍 116
基本功能 126
汇总和计算描述统计 142
处理缺失数据 148
层次化索引 153
其他有关pandas的话题 158
第6章 数据加载、存储与文件格式 162
读写文本格式的数据 162
二进制数据格式 179
使用HTML和Web API 181
使用数据库 182
第7章 数据规整化:清理、转换、合并、重塑 186
合并数据集 186
重塑和轴向旋转 200
数据转换 204
字符串操作 217
示例:USDA食品数据库 224
第8章 绘图和可视化 231
matplotlib API入门 231
pandas中的绘图函数 244
绘制地图:图形化显示海地地震危机数据 254
Python图形化工具生态系统 260
第9章 数据聚合与分组运算 263
GroupBy技术 264
数据聚合 271
分组级运算和转换 276
透视表和交叉表 288
示例:2012联邦选举委员会数据库 291
第10章 时间序列 302
日期和时间数据类型及工具 303
时间序列基础 307
日期的范围、频率以及移动 311
时区处理 317
时期及其算术运算 322
重采样及频率转换 327
时间序列绘图 334
移动窗口函数 337
性能和内存使用方面的注意事项 342
第11章 金融和经济数据应用 344
数据规整化方面的话题 344
分组变换和分析 355
更多示例应用 361
第12章 NumPy高级应用 368
ndarray对象的内部机理 368
高级数组操作 370
广播 378
ufunc高级应用 383
结构化和记录式数组 386
更多有关排序的话题 388
NumPy的matrix类 393
高级数组输入输出 395
性能建议 397
附录A Python语言精要 401



下载地址:网盘下载

转载于:https://www.cnblogs.com/long12365/p/9732122.html

### 回答1: 《利用Python进行数据分析》是一本非常经典的数据分析入门书籍,由Python数据分析领域的大牛Wes McKinney所著。该书详细介绍了Python数据分析领域的应用,包括数据清洗、数据处理、数据可视化等方面的内容。同时,该书还介绍了Python中常用的数据分析库,如NumPy、Pandas、Matplotlib等,以及如何使用这些库进行数据分析。对于想要学习Python数据分析的人来说,这本书是非常值得一读的。 ### 回答2: “利用Python进行数据分析”这本书是数据分析领域必读的经典之作,主要介绍了Python语言在数据分析上的应用。本书首先介绍了Python数据分析的基础知识,例如NumPy、Pandas、IPython等。然后深入探讨了数据可视化和时间序列分析等主题。本书的特点是配图丰富,文字简洁明了,适合初学者和工程师快速上手。本书适用于Python初学者、数据分析从业者和数据科学家等各个层次的人员学习使用。 Python具有易学、代码简洁、生态丰富、免费等优点,大大提高了大数据分析的效率。Python有许多优秀的数据分析库,例如NumPy、Pandas、Scipy、Matplotlib、Seaborn等,可以方便快捷地处理数据和进行可视化。NumPy用来处理大的数值数组和矩阵,提供了很多数学和统计函数。Pandas则用于处理结构化数据和时间序列数据,包括数据导入、数据清洗、重塑和分组等。Scipy提供了许多科学计算的工具,包括拟合、插值等。Matplotlib是Python最为流行的数据可视化库,可以用来制作各种图形。Seaborn则是基于Matplotlib的高级可视化库,可以用来制作更加漂亮的图形。 其他在本书中介绍的工具包括IPython、Jupyter Notebook、SciPy、Statsmodels、scikit-learn、NLTK等。IPythonPython交互式shell的增强版,结合了代码编辑、调试、分析和可视化等功能。Jupyter Notebook是一种基于Web的笔记本式界面,可以用于数据分析、科学计算、数据可视化和机器学习等领域。SciPy是一种快速稳定的科学计算库,包括许多有用的函数和常用算法。Statsmodels是Python中一个强大的统计模型库,可以用于估计各种统计模型,例如线性回归和时间序列。scikit-learn则提供了许多机器学习算法和工具,例如分类、聚类、降维和模型选择等。NLTK是自然语言处理的核心工具库,可以帮助我们处理文本和语言。 总而言之,“利用Python进行数据分析”这本书可以帮助我们了解Python数据分析上的应用和基础知识,并介绍了许多常用的数据分析工具。对于需要使用Python进行数据分析的人员来说,这本书可以提供很多实用的知识和参考。 ### 回答3: 《利用Python进行数据分析 PDF》是一本通俗易懂、内容全面的数据分析读物,许多Python数据科学家对此赞誉有加。本书作者Wes McKinney是Pandas数据分析包的开发者之一,因而在解剖数据分析技术要点方面具备资格。在本书中,他讲述了实用的Python技术和工具,适合所有数据分析师、数据科学家和业务分析员使用。接下来,我们将深入探讨一下如何利用Python进行数据分析PDF。 首先,本书介绍了Python编程语言,包括Python语法、控制流、函数、自定义类型和模块等方面的知识,并详细讲解了Python可扩展性和数据分析库的使用方法。数据分析库包括Numpy、Pandas、Matplotlib和Scipy等,它们都是Python数据分析的重要支持组件。在使用这些库时,本书有较为详细的说明,帮助读者快速掌握Python数据分析的关键要点。 其次,本书涉及了一系列数据分析技术,如数据清洗、数据合并和重塑、时间序列分析、数据可视化等。并且在讲解的过程中,本书很多地方都配上了Python代码,这样读者能够更好地理解和掌握所讲的内容。通过学习本书,读者可以了解到如何以Python为基础进行数据分析、如何处理各种类型的数据,以及如何将数据可视化以便更好地理解和展示数据。 最后,本书强调了Python数据分析的实用性。随着数据分析领域的日趋重要,许多企业和组织也正在加速转向Python数据分析。因此,学习本书所提供的知识和技能将为读者的职业发展和升职打下坚实基础。 总之,《利用Python进行数据分析 PDF》是一本极具价值的数据分析读物。无论是初学者还是高级数据分析师,都可以从本书中学到实用的Python数据分析技术并加深对数据分析的理解。本书将成为数据分析人员的指南,帮助读者快速了解和熟练运用Python数据分析工具和技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值