- 博客(1)
- 收藏
- 关注
原创 解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xcc in position 0: invalid continuation byte
在服务器上跑Test-summarize-Chinese的时候,在制作数据集的时候遇到了UnicodeDecodeError的问题,解决办法搜了很久才找到。现在先罗列一些对我来说没有用的做法:1. 因为写的是utf-不能解码,所以在df = pd.read_csv('./PreLCSTS/%s.csv' % file, header=None)中加了encoding = 'gbk'以错误告终2. 尝试了其他的解码方式,encoding='gb18030'还是以错误告终3.最
2021-11-08 14:38:34
9948
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人