pd.read_csv出现Error tokenizing data. C error: Expected 4097 fields in line 408, saw 4098解决方案

最新推荐文章于 2024-08-14 17:04:17 发布

大屁孩。

最新推荐文章于 2024-08-14 17:04:17 发布

阅读量4.8k

点赞数 3

CC 4.0 BY-SA版权

分类专栏： python

本文链接：https://blog.youkuaiyun.com/smile_Shujie/article/details/96279848

13 篇文章

订阅专栏

本文介绍了一种在使用pandas的read_csv方法时遇到的错误：“标记化数据时出错，数据的结构不正确”，并提供了两种解决方案：一是事前处理好数据，保持数据结构的统一；二是通过在read_csv方法中添加error_bad_lines=False参数来忽略有问题的行。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在使用pandas的read_csv方法的时候出现了如下错误：

Error tokenizing data. C error: Expected 4097 fields in line 408, saw 4098

标记化数据时出错，数据的结构不正确，这个文件一行应该有4097个数据，但在第408行出现了4098个数据。

事先处理好数据，让数据的结构统一；
如果不能处理数据，只能将就着使用的话，在read_csv方法中添加如下参数即可：error_bad_lines=False，例如：faces_data = pd.read_csv( ‘faces.data’, sep=’\t’, header=None, error_bad_lines=False）