问题描述:
处理数据时,出现了bug,本来已经找小的文件测试过,按理说是没有问题的,不知道为什么会一直有这个错误。在网上找了解决方法,一直没有解决,直到看到了一篇文章,终于解决了问题。
File "pandas\_libs\parsers.pyx", line 847, in pandas._libs.parsers.TextReader.read
File "pandas\_libs\parsers.pyx", line 862, in pandas._libs.parsers.TextReader._read_low_memory
File "pandas\_libs\parsers.pyx", line 918, in pandas._libs.parsers.TextReader._read_rows
File "pandas\_libs\parsers.pyx", line 905, in pandas._libs.parsers.TextReader._tokenize_rows
File "pandas\_libs\parsers.pyx", line 2042, in pandas._libs.parsers.raise_parser_error
pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 38384, saw 2
原因分析:
主要是因为我懒,直接把三个.xlsx文件,直接改后缀名,变成了.csv文件,但其实是不可以的,两者还是有区别的。所以造成处理数据一直报错。
解决方案:
把.xlsx文件改成.csv文件时,不能直接改后缀名,要用另存为,改成csv文件。
在处理数据时遇到ParserError,原因是直接将.xlsx文件后缀改为.csv导致。正确做法是使用'另存为'方式,确保数据格式正确。忽视文件格式差异会引发解析错误。
1万+

被折叠的 条评论
为什么被折叠?



