实战常用指令——dataframe相关操作

1. 基本操作

功能描述代码示例说明
创建DataFramedf = pd.DataFrame(data, columns=[列名列表])从字典、列表或数组创建DataFrame
读取CSV文件df = pd.read_csv('文件路径.csv')从CSV文件加载数据
查看前N行df.head(n)默认显示前5行
查看后N行df.tail(n)默认显示后5行
查看基本信息df.info()显示列名、非空值数和数据类型
查看统计摘要df.describe()数值列的统计信息(均值、标准差等)

2. 数据筛选与选择

功能描述代码示例说明
选择单列df['列名'] 或 df.列名返回Series(单列数据)
选择多列df[['列名1', '列名2']]返回新的DataFrame
按行索引选择df.loc[行索引]通过标签选择行
按位置选择行df.iloc[行位置]通过整数位置选择行
条件筛选df[df['列名'] > 值]返回满足条件的行
多条件筛选df[(条件1) & (条件2)]使用 &(与)、`
按行/列切片df.loc[起始行:结束行, 起始列:结束列]类似Python切片

3. 数据处理

功能描述代码示例说明
添加新列df['新列'] = 值或计算表达式直接赋值或基于现有列计算
删除列df.drop('列名', axis=1, inplace=True)axis=1表示列,inplace直接修改原数据
删除行df.drop(行索引, axis=0)axis=0表示行
填充缺失值df.fillna(值) 或 df.fillna({'列名': 值})用指定值填充NaN
删除缺失值df.dropna()删除包含NaN的行或列
替换值df.replace(旧值, 新值)全局替换
重命名列df.rename(columns={'旧列名': '新列名'})修改列名

4. 数据统计与聚合

功能描述代码示例说明
求和df.sum() 或 df['列名'].sum()按列或行求和
求平均值df.mean()计算均值
分组聚合df.groupby('列名')['聚合列'].agg(函数)如 agg(['mean', 'sum'])
唯一值统计df['列名'].unique() 或 df['列名'].nunique()返回唯一值或唯一值数量
值计数df['列名'].value_counts()统计每个值的出现次数

5. 数据排序与连接

功能描述代码示例说明
按列排序df.sort_values('列名', ascending=False)ascending控制升序/降序
按多列排序df.sort_values(['列1', '列2'])先按列1排序,再按列2排序
合并DataFrame(横向)pd.concat([df1, df2], axis=1)按列合并(axis=1)
合并DataFrame(纵向)pd.concat([df1, df2], axis=0)按行合并(axis=0)
连接(类似SQL JOIN)pd.merge(df1, df2, on='键列', how='inner')how可选inner/left/right/outer

6. 其他实用操作

功能描述代码示例说明
重置索引df.reset_index(drop=True)drop=True避免旧索引成为新列
设置索引列df.set_index('列名')将指定列设为索引
应用函数df['列名'].apply(lambda x: 函数(x))对列中每个元素应用函数
保存到CSVdf.to_csv('路径.csv', index=False)index=False避免保存索引列
保存特定的列到csv

df[['列名1','列名2']].to_csv('selected_columns.csv', index=False)

选中特定的行形成df
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

踏歌~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值