最近小白在做中文情感分析的时候,经常使用到文件打开出错的问题,尝试了很多方式,都不成功,这里写下自己的新路历程。
1.首先,下面是正常的读文件代码
sen_file = open('D:/Users/Downloads/BosonNLP_sentiment_score.txt','r')
sen_list = sen_file.readlines()
报错如下:

网上随便搜,有一堆答案,接下来看下各种解决办法
2.修改编码方式
encoding改为UTF-8,有的小伙伴试到这一步,已经不需要继续了,问题完美解决
sen_file = open('D:/Users/Downloads/BosonNLP_sentiment_score.txt','r', encoding='UTF-8')
sen_list = sen_file.readlines()
有的依然会报上述问题,那么继续换编码方式:‘utf-8’换成‘gbk’
sen_file = open('D:/Users/Downloads/BosonNLP_sentiment_score.txt','r', encoding='gbk')
sen_list = sen_file.readlines()
若不能解决,可能是文本中出现的一些特殊符号超出了gbk的编码范围,可以选择编码范围更广的‘gb18030’
sen_file = op

最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



