利用Python进行数据分析

本文详细介绍了Python数据分析的基础,包括Python语言、内建数据结构、Numpy、pandas、数据清洗和可视化。重点讲解了Numpy的数组和向量化计算,pandas的数据结构及其操作,以及数据清洗和预处理的技巧。最后探讨了绘图和数据可视化的基本方法,如matplotlib和seaborn库的使用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.预备知识

一些重要的Python库:

Numpy

pandas

matplotlib

Scipy

scikit-learn

statsmodels

二.Python语言基础

缩进   import   运算符(is    is not)  

数据类型:数值型    字符串   Bytes  Unicode     时间类型     布尔型      空值(None)

控制流程:if   elif   else     for循环(for...in...)    while循环   pass    range函数    三元表达式

三.内建数据结构,函数和文件

1.数据结构与序列

1.tuple:元组  长度固定,不可改变的序列     用( )或只用逗号表示

2.list:列表    大小和内容都可以变    用[ ]表示

append   insert   remove     extend     sort(直接更改原有的序列)   切片

bisect.bisect        bisect.insort

3.内建的序列函数:enumerate      sorted(返回一个新的序列)     zip    reversed

4.dict:字典    key : value形式       用{ }表示

in    del   pop   update(合并两个dict) get       setdafault       hash

d1.keys      d1.values             

5.set:集合      无序且元素是不重复的,就像是key唯一且没有value的字典      用{ }表示

并集:union、|       交集:intersection、&       差集:difference、-      对称差集(x-y与y-x的并集):symmetric_difference、^

子集:issubset        超集:issuperset

6.list,set和dict推导式

map     嵌套列表表达式

2.函数

1. 命名空间,作用范围,局部函数

2.返回多个值(返回一个tuple)

3.函数是对象

4.匿名函数,lambda函数

5.柯里化(Currying):局部参数应用

6.生成器 Generators

7.错误和异常处理

3.文件以及操作系统

 open   close     read      write      seek      

with  open(path)   as  f :  ...      这种打开方式可以自动关闭文件

四.Numpy基础:数组和向量化计算

1.多维数组对象

np.random.randn       

np.array   np.zeros  np.empty    np.arange     np.arange().reshape()     <

Python的设计哲学是“优雅”、“明确”、“简单。Python用途极广。图形处理:有PIL、Tkinter等图形库支持,能方便进行图形处理。 数学处理:NumPy扩展提供大量与许多标准数学库的接口。 文本处理:python提供的re模块能支持正则表达式,还提供SGML,XML分析模块,许多程序员利用python进行XML程序的开发。 数据库编程:程序员可通过遵循Python DB-API(数据库应用程序编程接口)规范的模块与Microsoft SQL Server,Oracle,Sybase,DB2,MySQL、SQLite等数据库通信。python自带有一个Gadfly模块,提供了一个完整的SQL环境。 网络编程:提供丰富的模块支持sockets编程,能方便快速地开发分布式应用程序。很多大规模软件开发计划例如Zope,Mnet 及BitTorrent. Google都在广泛地使用它。 Web编程:应用的开发语言,支持最新的XML技术。 多媒体应用:Python的PyOpenGL模块封装了“OpenGL应用程序编程接口”,能进行二维和三维图像处理。PyGame模块可用于编写游戏软件。 pymo引擎:PYMO全称为python memories off,是一款运行于Symbian S60V3,Symbian3,S60V5, Symbian3, Android系统上的AVG游戏引擎。因其基于python2.0平台开发,并且适用于创建秋之回忆(memories off)风格的AVG游戏,故命名为PYMO。 黑客编程:python有一个hack的库,内置了你熟悉的或不熟悉的函数,但是缺少成就感。 用Python写简单爬虫
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值