python3读取中文路径的csv文件(read_csv)处理方法

本文介绍如何在Python环境下,使用Pandas读取中文路径的CSV文件时遇到的OSError,并提供了解决方案。通过将文件转换为文件流,可以避免错误,成功导入数据。此外,针对GBK编码的CSV文件,文章还提供了额外的处理步骤。

在刚开始学习pandas的时候,当我们导入中文路径的CSV文件的时候,会得到如下的报错

  • 在read_csv(中文路径名)时,系统会报错: OSError: Initializing from file failed

通过一个转换,我们就能像英文路径一样可以直接导入数据。

通过Open把文件转换成文件流,这样python程序就能识别了。

o=open(path)
完整的解决办法如下:

  1. 1.#背景是python3.6
    2.path=r’F:\目录\1.csv’
    #通过open操作中转一下(应该是转换成python内置的文件流了)

    o=open(path)
    f=pd.read_csv(o)
    o.close

2、如果csv文件是gbk格式的呢?我们还得修改一下:'
path=r’F:\目录\1.csv’
o=open(path,‘rb’)
f=pd.read_csv(o)
o.close

### 使用 Pandas 读取 CSV 文件 Pandas 提供了一个强大的函数 `read_csv` 来处理 CSV 文件。此方法不仅能够解析标准的逗号分隔文件,还支持多种自定义参数来适应不同格式的数据源[^1]。 对于基本操作而言,仅需提供目标文件路径作为参数即可加载整个文档: ```python import pandas as pd df = pd.read_csv('example.csv') print(df.head()) ``` 当遇到含有日期字符串的情况时,可以启用自动解析功能,使数据更加易于分析和处理: ```python df_with_dates = pd.read_csv('dates_example.csv', parse_dates=True) print(df_with_dates.dtypes) ``` 如果CSV文件缺少表头或希望重命名现有列,则可以通过传递列表给`names`参数实现这一点[^2]: ```python custom_headers_df = pd.read_csv( 'no_header_file.csv', header=None, names=['First Column', 'Second Column'] ) print(custom_headers_df.columns) ``` 为了更灵活地控制输入过程中的细节设置,比如指定分隔符、跳过特定行数等高级选项也一应俱全。下面是一个综合性的例子展示了部分可用配置项: ```python complex_read = pd.read_csv( filepath_or_buffer='complicated_format.csv', sep=',', # 定义字段间的分割符号,默认为逗号 skiprows=range(1, 5), # 跳过的行范围 usecols=[0, 2], # 只选取第1列和第3列 dtype={'ColumnA': str}, # 设置某几列的数据类型转换规则 na_values=['NA'], # 自定义缺失值标记 encoding='utf-8' # 文本编码方式 ) print(complex_read.info()) ``` 通过上述介绍可以看出,`pandas.read_csv()` 是一个非常强大而灵活的工具,在实际应用中可以根据具体需求调整相应的参数获得理想的结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值