python3读取中文路径的csv文件(read_csv)处理方法

今天重新想导入CSV文件,报错了,想起以前在简书上做的备忘记录,为了方便以后查看,还是复制一份过来,方便统一管理。

在刚开始学习pandas的时候,当我们导入中文路径的CSV文件的时候,会得到如下的报错:

在read_csv(中文路径名)时,系统会报错:
OSError: Initializing from file failed

通过一个转换,我们就能像英文路径一样可以直接导入数据。
通过Open把文件转换成文件流,这样python程序就能识别了。

o=open(path)

完整的解决办法如下:

#背景是python3.6
path=r'F:\目录\1.csv'
#通过open操作中转一下(应该是转换成python内置的文件流了)
o=open(path)
f=pd.read_csv(o)
o.close

2、如果csv文件是gbk格式的呢?我们还得修改一下:

path=r'F:\目录\1.csv'
o=open(path,'rb')
f=pd.read_csv(o)
o.close
### 使用 Pandas 读取 CSV 文件 Pandas 提供了一个强大的函数 `read_csv` 来处理 CSV 文件。此方法不仅能够解析标准的逗号分隔文件,还支持多种自定义参数来适应不同格式的数据源[^1]。 对于基本操作而言,仅需提供目标文件路径作为参数即可加载整个文档: ```python import pandas as pd df = pd.read_csv('example.csv') print(df.head()) ``` 当遇到含有日期字符串的情况时,可以启用自动解析功能,使数据更加易于分析和处理: ```python df_with_dates = pd.read_csv('dates_example.csv', parse_dates=True) print(df_with_dates.dtypes) ``` 如果CSV文件缺少表头或希望重命名现有列,则可以通过传递列表给`names`参数实现这一点[^2]: ```python custom_headers_df = pd.read_csv( 'no_header_file.csv', header=None, names=['First Column', 'Second Column'] ) print(custom_headers_df.columns) ``` 为了更灵活地控制输入过程中的细节设置,比如指定分隔符、跳过特定行数等高级选项也一应俱全。下面是一个综合性的例子展示了部分可用配置项: ```python complex_read = pd.read_csv( filepath_or_buffer='complicated_format.csv', sep=',', # 定义字段间的分割符号,默认为逗号 skiprows=range(1, 5), # 跳过的行范围 usecols=[0, 2], # 只选取第1列和第3列 dtype={'ColumnA': str}, # 设置某几列的数据类型转换规则 na_values=['NA'], # 自定义缺失值标记 encoding='utf-8' # 文本编码方式 ) print(complex_read.info()) ``` 通过上述介绍可以看出,`pandas.read_csv()` 是一个非常强大而灵活的工具,在实际应用中可以根据具体需求调整相应的参数获得理想的结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值