在使用pandas的read_csv方法的时候出现了如下错误:
Error tokenizing data. C error: Expected 4097 fields in line 408, saw 4098
错误原因
标记化数据时出错,数据的结构不正确,这个文件一行应该有4097个数据,但在第408行出现了4098个数据。
解决方案
- 事先处理好数据,让数据的结构统一;
- 如果不能处理数据,只能将就着使用的话,在read_csv方法中添加如下参数即可:error_bad_lines=False,例如:faces_data = pd.read_csv( ‘faces.data’, sep=’\t’, header=None, error_bad_lines=False)