pandas 读取csv文件简单操作

本文详细介绍使用Python的Pandas库读取CSV文件的方法,包括如何选择性地读取特定列、转换数据类型、限制读取行数及展示数据前几行等技巧,帮助读者快速掌握数据处理技能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

先引入pandas库

import pandas as pd

使用read_csv()方法,读取整个.csv文件;

df = pd.read_csv(filepath_or_buffer='music.csv')

read_csv()其他常用参数:

  • usecols:列表类型,默认None
    E.g. usecols=[1, 2, 3],取文件指定列,默认全部列
  • names:列表类型,默认None
    E.g. names=[‘size’, ‘category’],作为每一列的名字
  • dtype:字典类型,默认None
    E.g. dtype= {‘size’: int} ,将size转换为int类型
  • nrows: 读取文件前几行
    E.g. nrows=3,只去读文件前三行
#  head() 方法:取前几行数据,参数为空默认展示5行数据,可以传入其他数字。
#  tail() 方法:倒着从后读取后几行数据,用法同上。
df.head()

在这里插入图片描述
columns 方法:打印列名。

print(df.columns)

Index(['歌单名', '作者', '播放次数', '创建时间', '标签', 'URL'], dtype='object')

shape 方法:打印数据的维度

print(df.shape)

(6866, 6)  #一共有6866行6列

取行数据

loc方法:读取行数据

# 打印第三行的数据
print(df.loc[3])

在这里插入图片描述

# 打印一至三行的数据,类似列表的切片操作
print(df.loc[1: 3])

# 打印1, 3, 5行的数据, 传入一个带有行号的列表
print(df.loc[[1, 3, 5]])

取列数据

通过列名取一列数据

df[playTimes]  或者 df.playTimes

通过多个列名取多列数据,传入一个含有多个列名的列表

df[['author', 'playTimes']]
### 如何使用 Pandas 在 Python 中读取 CSV 文件 在 Python 中,Pandas 是一个强大的数据分析库,提供了简单易用的接口来处理 CSV 文件。以下是一个详细的说明和示例代码。 要读取 CSV 文件,可以使用 `pandas.read_csv()` 方法[^1]。此方法允许指定文件路径、编码方式以及其他参数以适应不同的文件格式需求。例如,如果文件包含中文字符,可能需要设置适当的编码格式(如 `gbk` 或 `utf-8`)[^1]。 以下是使用 Pandas 读取 CSV 文件的基本示例代码: ```python import pandas as pd # 指定文件路径和编码方式 df = pd.read_csv('property-data.csv', encoding="gbk") # 使用 gbk 编码处理中文字符 print(df.to_string()) # 打印整个 DataFrame 的内容 ``` 在上述代码中: - `'property-data.csv'` 是目标 CSV 文件的路径。 - `encoding="gbk"` 指定了文件的编码格式,适用于包含中文字符的文件[^1]。 - `df.to_string()` 将整个 DataFrame 转换为字符串并打印,确保输出所有行和列。 此外,还可以通过传递自定义列名来读取 CSV 文件。例如: ```python import pandas as pd # 自定义列名 df = pd.read_csv('data.csv', names=['ts_code', 'symbol', 'name', 'area', 'industry', 'list_date'], index_col=None) print(df.head()) # 显示前几行数据 ``` 在此代码中: - `names` 参数用于定义自定义列名[^4]。 - `index_col=None` 表示不将任何列设置为索引[^4]。 ### 高级功能 如果需要逐行读取大型 CSV 文件,可以结合 `chunksize` 参数分块读取,避免内存不足的问题[^2]: ```python import pandas as pd # 分块读取 CSV 文件 chunk_size = 1000 # 每次读取的行数 chunks = [] for chunk in pd.read_csv('large_file.csv', chunksize=chunk_size): chunks.append(chunk) # 合并所有分块 df = pd.concat(chunks, ignore_index=True) print(df.head()) ``` 以上代码展示了如何通过分块读取大型 CSV 文件,并将其合并为一个完整的 DataFrame[^2]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值