《python数据分析与应用》第四章:pandas统计分析基础

本章节介绍了pandas在Python数据分析中的基本操作,包括读写数据库数据、文本文件、Excel文件,重点讲解了DataFrame的属性查看、数据改查增删、描述性统计以及时间序列数据的处理。通过实例演示了如何读取SQL数据库、CSV和Excel数据,以及如何进行数据分组聚合和创建透视表。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第四章

4.1 读写不同数据源的数据
4.1.1 读/写数据库数据

1.数据库数据读取:

注意:数据库的用户名(一般都是root)和密码(自己设置的)都是要用自己的,地址默认的127.0.0.1

读取函数(你自己把文件存在哪了?)和存储函数(你要把问价存在哪?)的路径,一定要区别开

先明确读取表与查询表的区别:
①查询的数据集合时临时存在的;
②不同查询的条件产生不同的数据集合,是对原数据的重新整合;
③当关闭查询后,查询记录随之清空,保存下来的只有查询方式,再次打开查询重新调入数据。

查询操作仿佛新建了一个数据表(其实没有)来储存符合查询命令的数据集,它使原数据发生了临时性的改变,对原数据进行了整合操作;而读取就是读原数据的所有信息,没有对原数据进行整合操作。

read_sql_table:只能读取数据库中的某一个表格,不能实现查询的操作,第一个参数是具体的表格名称;
read_sql_query:只能实现查询操作,不能直接读取,第一个参数是sql语句(查询数据库或者某个表格);
read_sql:是上面两者的集合,既能读取也能查询,第一个参数是表名或者sql语句。

2.数据库数据存储:to_sql
4.1.2 读/写文本文件
1.文本文件读取
read_table读取文本文件,read_csv读取CSV文件
2.文本文件存储:to_csv
4.1.3 读/写Excel文件
1.Excel文件读取:read_excel
2.Excel文件存储:to_excel
4.1.4任务实现
1.读取订单详情数据库数据
2.读取订单信息CSV数据
3.读取客户Excel数据

4.2 掌握DataFrame的常用操作
4.2.1查看DataFrame的常用属性
values元素,index索引,columns列名,dtypes类型,
siz

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值