pd.read_csv问题

本文介绍使用pd.read_csv()函数读取CSV文件的关键参数,包括路径设置、分隔符选择、自定义缺失值处理及数据类型指定等。适用于需要处理CSV数据的开发人员。

pd.read_csv()重要参数
 

filepath_or_buffer  路径

sep=',' 分隔符

 names=None, 列名 names = ["a", "b", "c"]

na_values=None,    默认 ‘’, ‘#N/A’, ‘#N/A N/A’, ‘#NA’, ‘-1.#IND’, ‘-1.#QNAN’, ‘-NaN’, ‘-nan’, ‘1.#IND’, ‘1.#QNAN’, ‘<NA>’, ‘N/A’, ‘NA’, ‘NULL’, ‘NaN’, ‘n/a’, ‘nan’, ‘null’处理成空

可以自己指定na_values = ["None",  "none", ]

读取之后的数据格式

dtype参数可以指定数据格式。

但此方法会自动处理数据格式, 1111处理成int, "ssss" 处理成str, 1.0 处理成float

`pandas` 库中的 `pd.read_csv()` 函数用于读取 CSV(逗号分隔值)文件,并将其转换为 `DataFrame`,适用于数据分析、数据清洗、机器学习等任务。以下是该函数的详细解释: ### 语法 ```python import pandas as pd df = pd.read_csv(filepath, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None) ``` ### 常用参数 | 参数 | 作用 | | --- | --- | | `filepath` | CSV 文件路径(本地路径或 URL) | | `sep` | 分隔符(默认 `,`,支持 `\t`(TSV)) | | `header` | 指定标题行(`header=None` 表示无表头) | | `names` | 设定列名(适用于无标题 CSV) | | `index_col` | 设置索引列(`index_col=0` 代表第一列为索引) | | `usecols` | 选择要读取的列(`usecols=["col1", "col2"]`) | | `dtype` | 指定列的数据类型(`dtype={"col1": str, "col2": float}`) | | `nrows` | 读取前 `n` 行数据 | | `skiprows` | 跳过前 `n` 行(`skiprows=10` 跳过前 10 行) | | `encoding` | 指定编码格式(如 `utf-8`,`latin1`,`gbk`) | | `parse_dates` | 用于解析日期列,可传入列名列表,如 `parse_dates=['date']` [^1]。 | ### 示例代码 #### 读取标准 CSV ```python import pandas as pd df = pd.read_csv("data.csv") print(df.head()) # 查看前 5 行 ``` #### 读取 CSV 文件,并指定 `date` 列为日期类型 ```python import pandas as pd # 读取 CSV 文件,并指定 date 列为日期类型 df_read = pd.read_csv('example.csv', parse_dates=['date']) # 查看 DataFrame 类型 print(df_read.dtypes) ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值