关于pandas调用read_csv读取txt文件在没有报错的情况下读取不完全问题

原创于 2023-02-07 11:51:30 发布 · 1k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python

在使用Python的pandas库读取带有引号的中文txt文件时，发现行数不正确。问题源于行内的引号导致的字符串解析错误。通过删除引号后，读取恢复正常，无漏行现象。

遇到了一种情况，在用pd.read_csv('file_name.txt', sep='\t',name=['column1','column2'])时，读取出来的行数比真实的txt中包含的行数少的问题，且不显示报错。

由于读取的文件是中文的，想到改编码方式，然而改了编码方式也没用。

随后使用二分查找，找到被吞的行。在将“无故被吞”的行数单独放入单独的txt文件进行读取，发现了报错：

原来是因为行中有引号，导致有inside的string。将引号删除后问题解决，大文件中也没有漏行了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ant_hahi

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

100天精通Python（数据分析篇）——第56天：Pandas读写txt和csv文件（read_csv、to_csv参数说明+代码实战）

努力让自己发光，对的人才能迎着光而来

09-19

29万+

100天精通Python（数据分析篇）——第56天：Pandas读写txt和csv文件（read_csv、to_csv）一、文本文件 1. read_csv() skiprows nrows index_col names 2. to_csv() sep na_rep columns header index

Python pandas 读取csv/txt数据文件 python读取csv/txt文件

Archie优快云的博客

10-23

2357

Python pandas 读取csv/txt数据文件 python读取csv/txt文件

参与评论您还未登录，请先登录后发表或查看评论

pandas 用read_csv读取txt文件时，部分行丢失

春天

04-25

5266

用pandas 的 read_csv 来读取txt文件时，出现了部分行丢失的情况。原因是某行中有单个英文引号，导致\n换行符失效。多行连成了一行，直到遇到下一个单个引号。例如： .txt文件如下：这里有一个未闭合的引号"就是它！这是正常的第二行这是正常的“第三行” 这是带着"英文引号"的第四行这是第五行如果不存在不闭合的英文引号，行与行之间会“粘”在一起，看起来就是丟行...

Python两种读取txt与csv文件方式（利用numpy处理数据）

kaimendajilian的博客

01-01

9571

Python读取CSV与TXT文件并转换为numpy处理数据

print 打印pandas.read_csv 数据不全

weixin_34347651的博客

05-27

1543

2019独角兽企业重金招聘Python工程师标准>>> ...

解决pandas read_csv 读取中文列标题文件报错的问题

09-20

### 解决pandas read_csv 读取中文列标题文件报错的问题在处理中文字符集的CSV文件时，经常会遇到由于编码问题导致的错误。本文将深入探讨如何使用Python的pandas库正确读取含有中文列标题的CSV文件，并解决在这一...

Pandas之read_csv()读取文件跳过报错行的解决

09-17

### Pandas之read_csv()读取文件跳过报错行的解决方案 #### 一、问题背景及场景在日常的数据处理工作中，我们经常会遇到需要从CSV文件中读取数据的情况。Pandas作为Python中非常强大的数据分析库之一，提供了`...

解决pandas使用read_csv()读取文件遇到的问题

09-20

总结来说，pandas库的read_csv()函数虽然功能强大，但在读取CSV文件时默认不识别数据的类型，会导致后续操作出错。通过正确使用dtype参数来指定数据类型，可以避免此类问题。当遇到数据类型错误时，我们需要根据实际...

解决pandas中读取中文名称的csv文件报错的问题

09-20

然而，当处理带有中文名称的CSV文件时，可能会遇到一些问题，尤其是在读取文件时。本篇文章将深入探讨这个问题，并提供解决方案。首先，我们要理解Pandas库中的`read_csv`函数，它是用来从CSV文件中加载数据到...

Pandas read_csv读取文本文件速度测试

weixin_42052836的博客

05-16

1851

Pandas read_csv读取文本文件速度测试目录 Pandas read_csv读取文本文件速度测试问题发现一、测试条件 1.测试环境 2.测试对象二、测试程序三、测试结果 1.Pandas1.0.3 read_csv读取文件 2.Pandas0.23.4read_csv读取文件 3.Pandas0.24.1read_csv读取文件 4.Pandas0.25.3read_csv读取文件总结和分析 1.测试总结 2.分析问题发现在将P...

利用Pandas 读取txt，csv文件，取某一列数据，数据纠错（将列中某个错误数据纠正）

weixin_51775090的博客

12-08

4001

pandas的使用记录

Pandas使用read_csv()函数，读取csv文件出现只有一列的情况

海棠花未眠的博客

11-16

9039

错误代码： import pandas as pd food_info = pandas.read_csv(path, "fix.csv") 执行结果： ParserWarning: Falling back to the 'python' engine because the 'c' engine does not support regex separators (separators > 1 char and different from '\s+' are interpreted as re

c++从txt中读取数据_pandas 中 read_csv 方法实例分析

weixin_39683692的博客

11-21

456

pandas 中的 read_csv 方法是一个十分强大的读入数据的方法，官网的 read_csv 的参数列表如下。看这些参数的解释，都能十分详细地了解该方法的用法，网络上也有很多中文版的参数翻译。但是，对于基本的应用情景，缺乏比较到位的解释，导致每次导入数据时都要看文档，试错数次才能正确读入数据，降低了数据分析的效率。本文旨在通过简单的例子，对该方法的具体应用做一个整体的总结和分析，以期覆盖常见...

Pandas 模块 - 读写(1)-csv/txt等文档-read_csv/to_csv

一分耕耘一分收获

11-17

8084

Pandas 还支持从外部读取或者写入数据，这也是办公自动化的重要基础。 Pandas 目前支持下面几种方式： Format Type Data Description R...

pd读取文件显示不全问题解决，如何显示全部的列

专注于各种资源、教程，免费分享

06-10

7051

import pandas as pd df = pd.read_csv('data/HR.csv') print(df.head()) 读取时值显示一部分列这时只需要加一句 pd.set_option(‘display.max_columns’, None) 就可以显示全部的列 import pandas as pd pd.set_option('display.max_co...

pandas.read_csv读取csv不完整问题处理

weixin_44252853的博客

03-08

4071

多的少说，直接上图说问题，这两天在写数据处理工具时，想通过新建一个csv后用csv模块写入数据后，用pandas读取并删除某一列后保存发现一个问题，在读取时只有3919行，所以只处理了3919行，后面的数据都没删干净。后面怎么都想不通为什么，盲猜可能是因为写入的时候没结束，然后调整了一下发现果然是这个问题导致的。这是调整后程序出来的有没有大佬可以解释一下具体原因？ ...

python read_csv 大文件出错_使用读取数据时处理异常熊猫.read_csv()

weixin_32029863的博客

01-14

814

我想打开一个csv文件碎片pd.read_csv文件(path，chunksize=N)直到它以一种非常优雅和高效的方式结束。问题是，一旦指针从文件中取出，就会出现以下错误消息：df.get_chunk()Traceback (most recent call last):File "", line 1, in df.get_chunk()File "C:\Users\fedel\Anaconda...

python read函数报错_杨涛的Python位记录2——pd.read'csv函数中的一个错误：只能读取第一列,杨桃,点点,2pdreadcsv,bug...

weixin_34855166的博客

01-28

551

本人优快云博客专栏：https://blog.youkuaiyun.com/yty_7Github地址：https://github.com/yot777/Pandas是Python一个很有用的数据分析应用包，受到广大程序员的欢迎。今天本人在使用中发现pd.read_csv函数存在一个很有意思的bug，和大家分享一下。使用engine='python'参数消除告警首先我们查看一下需要读取的文本文件test0...

Python 用read_csv读取txt文件出现错误：ParserError: Error tokenizing data. C error: Expected 57 fields in line

Carol_Chen93的博客

12-05

2931

读取txt文件的代码如下： txtData = pd.read_csv(datafile, sep =',', compression = 'gzip', header=None) 出现如下错误： ParserError: Error tokenizing data. C error: Expected 57 fields in line 66, saw 58 目前网上普遍的解决方法都...

为什么python中用pandas.read_csv读取tsv文件后，再根据列的名称调用其中内容时总是报错键不存在