python的csv.reader中文乱码_Python CSV DictReader，带有UTF-8数据

最新推荐文章于 2022-09-09 13:35:12 发布

最新推荐文章于 2022-09-09 13:35:12 发布 · 555 阅读

文章标签：

#python的csv.reader中文乱码

本文介绍了解决Python 2.6 csv模块无法处理Unicode数据的问题，提供了一个自定义的UnicodeDictReader函数，用于从UTF-8编码的CSV文件中按名称获取列值。适合处理大文件（MB级别）的CSV操作。

AFAIK, the Python (v2.6) csv module can't handle unicode data by default, correct? In the Python docs there's an example on how to read from a UTF-8 encoded file. But this example only returns the CSV rows as a list.

I'd like to access the row columns by name as it is done by csv.DictReader but with UTF-8 encoded CSV input file.

Can anyone tell me how to do this in an efficient way? I will have to process CSV files in 100's of MByte in size.

解决方案

Actually, I came up with an answer myself (sorry for replying to my own question):

def UnicodeDictReader(utf8_data, **kwargs):

csv_reader = csv.DictReader(utf8_data, **kwargs)

for row in csv_reader:

yield {unicode(key, 'utf-8'):unicode(value, 'utf-8') for key, value in row.iteritems()}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39563722

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

087、Python 读写CSV文件

不在同一频道上的呆子的博客

07-22

466

Python 读写CSV文件

【源码共读】手把手带你阅读 csv 模块中 DictReader 和 DictWriter 类的源码

weixin_37780776的博客

06-17

914

手把手带你阅读 csv 模块中 DictReader 和 DictWriter 类的源码

参与评论您还未登录，请先登录后发表或查看评论

Python自动化办公_读写CSV文件

weixin_49657263的博客

11-29

827

1、代码实现 import csv # 设置员工发展基金确认表路径 source_path = './员工发展基金确认表.csv' # 设置存放拆分结果文件的文件夹路径 result_path = './员工发展基金文件夹_demo/' # 打开员工发展基金确认表 with open(source_path, 'r', encoding='utf-8', newline='') as source_file: # 将文件对象转换为DictReader对象 source_csv =.

python中csv文件读取中文乱码问题

Slim's Hello World

11-30

970

之前都没规定过解码方式，今天突然就不行了。查了一下应该这么改直接国标转码就好了在read那一行改成—— data = pd.read_csv('hello.csv',encoding = 'gb2312') ...

python csv模块 reader_python模块，如csvDictReader，完全支持utf8

weixin_34849898的博客

02-19

261

您的数据不是用UTF-8编码的。它(主要)编码在cp1252中。数据似乎包括西班牙名字。最常见的非ASCII字符是'\xd1'(即带颚化符的拉丁文大写字母N)，这是导致异常的字符。在文件中的一个非ASCII字符是'\x8d'。它不在cp1252中。它出现在名字VASQUEZ中字母A应该出现的地方。其他的名字中，“\x94”(cp1252中的双引号)出现在名字的中间。其余的也可能代表错误。在我建议您...

csv_reader = csv.DictReader(csvfile)

热门推荐

weixin_47139649的博客

09-09

11万+

pandas对纯文本的读取提供了非常强力的支持，参数有四五十个。这些参数中，有的很容易被忽略，但是在实际工作中却用处很大。

python csv utf-8

03-08

好的，用户现在问的是关于Python中处理CSV文件时使用UTF-8编码的问题。之前他们问过LabVIEW中CSV的编码格式，特别是提到了不是gbk的情况。现在转向Python，可能需要比较两者在处理CSV时的异同。首先，我需要确认...

CSV.rar_csv

09-21

通过`csv.reader()`或`csv.DictReader()`，可以逐行读取并解析文件内容。 3. 写入CSV文件：同样地，我们可以通过`csv.writer()`或`csv.DictWriter()`在Python中写入CSV文件。这些类提供了方便的方法来创建新的CSV...

Python 3.x读写csv文件中数字的方法示例

09-21

在Python 3.x中，处理CSV（Comma-Separated Values）文件是常见的任务，尤其在数据处理和分析中。CSV文件是一种简单的文本文件，其中数据以逗号分隔，可以方便地用作数据交换格式。这篇教程将详细介绍如何在Python 3...

python导出csv乱码_python 生成csv乱码问题解决方法

weixin_39951018的博客

12-03

289

需求背景最近为公司开发了一套邮件日报程序，邮件一般就是表格，图片，然后就是附件。附件一般都是默认写到txt文件里，但是PM希望邮件里的附件能直接用Excel这种软件打开，最开始想保存为Excel，但是一想Excel的文件体积会多出好多倍，csv文件默认也是使用Excel打开的，但是根本还是文本文件，体积小，保存也方便，于是最终决定使用csv模块来保存文件。Python写csv文件Python提供了...

python的csv.reader中文乱码,Python CSV DictReader，带有UTF-8数据

weixin_28832121的博客

12-08

450

AFAIK, the Python (v2.6) csv module can't handle unicode data by default, correct? In the Python docs there's an example on how to read from a UTF-8 encoded file. But this example only returns the CSV...

csv python dictreader_csv dictReader编码不正确

weixin_39800918的博客

03-05

450

我有以下脚本来读取UTF-8 CSV：def readCSV(f, bdgs):with open(f) as csvfile:reader = csv.DictReader(csvfile, delimiter=';')for row in reader:for key, val in row.iteritems():print type(key), key,':',type(val),val...

python 读取csv文件时遇到中文

weixin_45155004的博客

07-25

741

#读取所需要的数据 path=‘logic_order.csv’ #数据的路径 data = pd.read_csv(path,header=None,names=[‘a’,‘b’,‘c’,‘d’],encoding=‘gb2312’) names=[‘a’,‘b’,‘c’,‘d’] 数据头 encoding='gb2312’设置编码的方式 ...

使用Python解决CSV文件中中文乱码的问题

BOKE

04-04

7972

如果CSV文件中的中文是乱码，通常该CSV文件的编码格式是UTF8的. 为了中文显示正常，需要将CSV文件的编码格式转换为GBK格式. 代码： import pandas as pd #utf编码格式的csv文件中的中文一般会是乱码，这时需要把文件格式另存为gbk格式 def csv_utf_2_gbk(srcPath): try: data=pd.DataFra...

python读取csv中文乱码_Python读取 csv文件中文乱码处理

weixin_39827315的博客

11-30

4471

需求：按行解析读取csv文件存入关系型数据库——主要是中文字体解析；遇到的问题：直接解析出来的数据为list形式，而且编码格式为unicode;解决问题：前提了解：中文编码的规则 —— GB2312字符串在Python内部的表示是unicode编码，在做编码转换时，通常需要以unicode作为中间编码，即先将其他编码的字符串解码（decode）成unicode，再从unicode编码（encode...

【网上很难找】python读取csv文件出错:显示utf-8编码问题该怎么解决

weixin_43343144的博客

09-15

3108

我使用utf-8是成功的，如果你的失败则可以参考：https://blog.csdn.net/yimixgg/article/details/80088809 【非常重要】csv文件使用python的open方法打开之前，要想utf-8编码生效,首先必须确保你的csv文件是utf-8格式，如何转换，方法很简单，使用记事本打开----点击另存为----选择utf-8编码即可 ...

python打开csvutf-8报错_关于utf 8：使用Python读取UTF8 CSV文件

weixin_39738755的博客

12-11

1859

我正在尝试用python(仅限法语和/或西班牙语字符)读取带有重音字符的csv文件。基于csvreader的python 2.5文档(http://docs.python.org/library/csv.html)，我想出了以下代码来读取csv文件，因为csvreader只支持ASCII。def unicode_csv_reader(unicode_csv_data, dialect=csv.ex...

python打开csvutf-8报错_用Python读取UTF8CSV文件

weixin_39706441的博客

12-11

353

用Python读取UTF8CSV文件我试图用Python读取带有重音字符的CSV文件(只有法语和/或西班牙语字符)。基于用于csvReader的Python2.5文档(http://docs.python.org/library/csv.html)，我想出了下面的代码来读取CSV文件，因为csvReader只支持ASCII。defunicode_csv_reader(unicode_csv_da...