当有引号嵌套时使用pandas读取数据可以用以下参数来避免错误
quoting=csv.QUOTE_NONE
- 作用:禁用引号处理,将所有内容按原样解析。
- 解释:
- 文件中的引号(
"
或'
)可能干扰解析,例如嵌套引号会被pandas
当作字段边界。
- 文件中的引号(
- 为什么有效:
- 文件中的字段包含复杂的嵌套引号(如
'' Goldman 's chief ...
),通过禁用引号处理(csv.QUOTE_NONE
),pandas
会将这些内容视为普通字符,从而避免解析错误。
- 文件中的字段包含复杂的嵌套引号(如
使用 pd.read_csv
时,通过设置参数,解决了原本解析错误的问题。以下是这些参数的作用说明,以及为什么它们能够正确解析你的数据。
参数解析
1. file_path
- 作用:指定要读取的文件路径。
- 你的文件路径:
file_path
指向包含数据的文件。