当用pandas.read_csv()读取一个文件,显示出来是乱码,大概率是文件编码方式的问题,如果文件gbk编码,则使用 e n c o d i n g encoding encoding参数可以解决这个问题。
df = pd.read_csv('https://blog.youkuaiyun.com/The_Time_Runner/article/details/83932807',encoding = 'gbk')
GBK编码(参考详解):全称是“汉字内码扩展规范”(GBK即“国标”、“扩展”汉语拼音的第一个字母,GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1国际标准,是前者向后者过渡过程中的一个承上启下的产物。
本文介绍了解决使用pandas库读取CSV文件时出现乱码的方法,主要原因是文件编码方式不匹配,通过指定正确的编码参数,如'gbk',可以避免乱码现象,确保数据正确读取。
5201

被折叠的 条评论
为什么被折叠?



