pandas操作

本文介绍了如何使用Pandas的read_csv()函数读取CSV文件,并展示了如何处理数据列。通过示例,展示了如何创建DataFrame,获取列信息以及将列转换为列表。此外,还演示了如何获取DataFrame的列名及其数据类型。

一、pandas读入csv文件
1、pd.read_csv()读入csv文件。

import numpy as np

data = pd.read_csv('./input/covid.train.csv')
x = data[data.columns[1:94]]
y = data[data.columns[94]]

2、columns用法
使用pandas处理列表的时候,调用上面的表头信息。
(1)建立一个excel形式文件

df = pd.DataFrame([[1, 2, 3]], columns=list("ABC"))

输出:

   A  B  C
0  1  2  3

(2)获得表头信息:

col = df.columns # 获取到的col是<class 'pandas.core.indexes.base.Index'>

输出

Index(['A', 'B', 'C'], dtype='object')

(3)获得列表形式表头

3)col = df.columns.values # 返回结果是数组

输出

['A' 'B' 'C']
Pandas 是一个开源的数据分析工具库,提供了丰富而强大的操作技巧,下面将介绍一些常用的 pandas 操作技巧。 1. 数据读取与写入:使用 pandas 可以方便地读取和写入不同格式的数据文件,如 CSV、Excel、数据库等。只需使用对应的读取函数(如 read_csv()、read_excel())和写入函数(如 to_csv()、to_excel())即可。 2. 数据清洗与处理:pandas 提供了丰富的数据处理功能,如处理缺失值、重复值、异常值等。处理缺失值可以使用 dropna() 删除包含缺失值的行或列,使用 fillna() 填充缺失值;处理重复值可以使用 duplicated() 判断是否重复,再使用 drop_duplicates() 删除重复值;处理异常值可以使用条件判断或使用正则表达式等方法。 3. 数据选择与切片:pandas 可以灵活地选择和切片数据,使得数据的访问和操作更加简便。可以使用 loc[] 和 iloc[] 选择指定行或列,也可以使用条件判断选择特定条件下的数据。 4. 数据合并与拼接:pandas 提供了多种方式实现数据的合并和拼接操作,如使用 merge() 按照指定的键进行合并,使用 concat() 进行行或列的拼接,使用 join() 进行索引的连接等。 5. 数据分组与聚合:pandas 可以根据指定的条件进行数据分组,并进行聚合操作,如求和、求均值、求最大值等。可以使用 groupby() 对数据进行分组,再使用 agg()、sum()、mean() 等函数进行聚合运算。 6. 数据可视化:pandas 也提供了简单而强大的数据可视化功能,通过 DataFrame 的 plot() 方法可以直接绘制各种图表,如折线图、柱状图、散点图等。 以上是一些常用的 pandas 操作技巧,掌握这些技巧可以更加高效地进行数据处理和分析。当然,这仅仅是 pandas 的冰山一角,还有很多其他的功能和用法可以进一步探索和学习。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值