遇到了一种情况,在用pd.read_csv('file_name.txt', sep='\t',name=['column1','column2'])时,读取出来的行数比真实的txt中包含的行数少的问题,且不显示报错。
由于读取的文件是中文的,想到改编码方式,然而改了编码方式也没用。
随后使用二分查找,找到被吞的行。在将“无故被吞”的行数单独放入单独的txt文件进行读取,发现了报错:

原来是因为行中有引号,导致有inside的string。将引号删除后问题解决,大文件中也没有漏行了。
在使用Python的pandas库读取带有引号的中文txt文件时,发现行数不正确。问题源于行内的引号导致的字符串解析错误。通过删除引号后,读取恢复正常,无漏行现象。
遇到了一种情况,在用pd.read_csv('file_name.txt', sep='\t',name=['column1','column2'])时,读取出来的行数比真实的txt中包含的行数少的问题,且不显示报错。
由于读取的文件是中文的,想到改编码方式,然而改了编码方式也没用。
随后使用二分查找,找到被吞的行。在将“无故被吞”的行数单独放入单独的txt文件进行读取,发现了报错:

原来是因为行中有引号,导致有inside的string。将引号删除后问题解决,大文件中也没有漏行了。
9039
551
2931

被折叠的 条评论
为什么被折叠?