pd.read_csv()详解(理解20%满足80%应用场景)

官方文档

pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None
`pandas` 库中的 `pd.read_csv()` 函数用于读取 CSV(逗号分隔值)文件,并将其转换为 `DataFrame`,适用于数据分析、数据清洗、机器学习等任务。以下是该函数的详细解释: ### 语法 ```python import pandas as pd df = pd.read_csv(filepath, sep=',', header='infer', names=None, index_col=None, usecols=None, dtype=None) ``` ### 常用参数 | 参数 | 作用 | | --- | --- | | `filepath` | CSV 文件路径(本地路径或 URL) | | `sep` | 分隔符(默认 `,`,支持 `\t`(TSV)) | | `header` | 指定标题行(`header=None` 表示无表头) | | `names` | 设定列名(适用于无标题 CSV) | | `index_col` | 设置索引列(`index_col=0` 代表第一列为索引) | | `usecols` | 选择要读取的列(`usecols=["col1", "col2"]`) | | `dtype` | 指定列的数据类型(`dtype={"col1": str, "col2": float}`) | | `nrows` | 读取前 `n` 行数据 | | `skiprows` | 跳过前 `n` 行(`skiprows=10` 跳过前 10 行) | | `encoding` | 指定编码格式(如 `utf-8`,`latin1`,`gbk`) | | `parse_dates` | 用于解析日期列,可传入列名列表,如 `parse_dates=['date']` [^1]。 | ### 示例代码 #### 读取标准 CSV ```python import pandas as pd df = pd.read_csv("data.csv") print(df.head()) # 查看前 5 行 ``` #### 读取 CSV 文件,并指定 `date` 列为日期类型 ```python import pandas as pd # 读取 CSV 文件,并指定 date 列为日期类型 df_read = pd.read_csv('example.csv', parse_dates=['date']) # 查看 DataFrame 类型 print(df_read.dtypes) ```
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值