< <学习笔记>>
一.DataFrame常用属性
1.基本属性
| 函数 | 返回值 |
|---|---|
| values | 元素 |
| index | 索引 |
| columns | 列名 |
| dtype | 数据类型 |
| size | 元素个数 |
| ndim | 维度数 |
| shape | 数据形状 |
二.增删查改DataFrame
1.索引(用键值对形式)
# 例:
import pandas as pd
data = pd.read_csv(r'C:\Users\zqh\Desktop\Python数据分析与应用人邮版\data\meal_order_info.csv',encoding='gbk')
print(data.columns)
print(data[['info_id','dining_table_name']][:5])
"""
返回data‘info_id’和‘dining_table_name’列前5行数据
"""
2.查看访问DataFrame中数据
- 使用iloc和loc访问
- 1)loc方法:接收索引名称
DataFrame.loc[行索引名称,列索引名称] - 2)iloc方法:接收索引位置
DataFrame.iloc[行索引位置,列索引位置] - 注意:区间索引:iloc是前闭后开,loc是前后闭
3.更新数据
取出数据列进行赋值更新
4.增添一列数据
DataFrame添加一列,只需新建一个列索引,并对该索引下的数据赋值即可
5.删除某列或某行数据
- drop方法
pd.DataFrame.drop(labels,axis=0,level=None,inplace=False)
#例:
import pandas as pd
# data = pd.read_table(r'C:\Users\zqh\Desktop\Python数据分析与应用人邮版\data\meal_order_info.csv',sep=',',encoding='gbk')
# print(data)
data = pd.read_csv(r'C:\Users\zqh\Desktop\Python数据分析与应用人邮版\data\meal_order_info.csv',encoding='gbk')
print(data.columns)
print(data[['info_id','dining_table_name']][:5])
print(data.drop('info_id',axis=1).columns)
三.描述分析DataFrame数据
1.pandas描述性统计方法
| 方法 | 说明 |
|---|---|
| min | 最小值 |
| man | 最大值 |
| mean | 均值 |
| median | 中位数 |
| var | 方差 |
| sem | 标准差 |
| skem | 样本偏差 |
| quantile | 四分位数 |
| describe | 描述统计 |
| ptp | 极差 |
| std | 标准差 |
| cov | 协方差 |
| mode | 众数 |
| kurt | 样本峰度 |
| count | 非空值数目 |
| mad | 平均绝对离差 |
本文详细介绍Pandas库中DataFrame的使用技巧,包括属性、数据访问、增删改查及描述性统计分析等核心功能,适合数据分析初学者及进阶者阅读。
2333

被折叠的 条评论
为什么被折叠?



