利用PYTHON进行数据分析 学习笔记

本书由唐学韬老师团队翻译,原作者为McKinney.W.,介绍Python在数据分析领域的应用,强调其在处理巨量数据和复杂分析上的优势,以及丰富的库资源如NumPy、Pandas等,适合初学者了解Python如何进行数据处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python for Data Analysis 这本书是唐学韬老师带领的团队在2013年就翻译完毕的著作。原书作者是美国的McKinney.W.。现在是2019年,Python的使用如火如荼,我不知道它是否已经发展成熟。Just do it.现在开始。。。也不晚

Python 给人的初次印象非常的好,工整、语法逻辑清晰,可以说非常类似于英语的自然语法了(我是说和一段标准的英文对话很类似了)。

作为一个初学者,我最最对Python感到崇拜的,就是它的LIST 和 for...in...:迭代循环,仔细想想其实我们的工作方式和思考方式就是这么个样子,把工作内容或思想排列成清单,然后一项项地处理。。。一项项地处理。。。,在迭代中,做出各种判断、给出其后的结果、或是论断。那本著名的《Head First Python》中开篇就告诉大伙——人人都爱LIST

 

本书中所说的“数据”,主要指的是结构化数据(structured data),比如:

  • 多维数组(矩阵)
  • 表格型数据
  • 通过关键列(对于SQL用户而言,就是主键和外键)相互联系的多个表
  • 间隔平均或不平均的时间序列
 

为什么要使用Python进行数据分析

我以前读一本教程时,最常做的事情之一就是忽略文章中的“为什么。。。”章节,我以为我既然看这本书,就是知道“为什么”,现在我明白,原来我是那么的“错”,看教程一定要仔细研读其中的“为什么。。。”;以前,我常做的另一件错事,就是基本不看书的“目录”,如果你也有这种习惯,让我们一起改正吧。

  • Python适合巨量的数据处理
  • Python适合复杂的数据分析
  • WEB框架(Django)
  • 活跃的科学计算社区
  • 丰富的“库”资源
  • Python是计算机语言“粘合剂”

完全可以只使用Python一种语言来构建以数据为中心的应用程序。通俗地说,Python最适合于统计学、探索性需求。作为一个科学计算平台,Python成功地集成C、C++、Fortran代码。

 

重要的Python库

利用Python进行数据分析,根本就是在和各种库在打交道,下面是最最常用的:

  • NumPy
  • Pandas
  • matplotlib
  • SciPy
 

安装和设置

为了数据处理而使用Python,就让我们在64base操作系统环境下,安装一个Anaconda(64-bit)环境吧,一路“next”,几乎不会出错。然后,所有其他需要安装的库,就“pip install module_name”,非常好使啊。

这一篇应该就是踏入数据分析的开始吧。我会坚持继续学习,也会继续修改上面这些文字,当我学得更深时,我也许会把上面的文字改的面目全非。

转载于:https://www.cnblogs.com/sam-xu/p/10859426.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值