在用akshare获取数据时,我将数据格式化为dataframe后直接存储为csv,谁知道在后面进行数据计算的时候,这个该死的符号总是导致计算莫名其妙的出错。
就是上图中数据最前面的那个 ’ 符号
一开始尝试的是用replace()方法直接将这个符号替代为空"",结果这符号纹丝不动!!!!
后来又去查了查为什么删不掉,看了N篇文章后,脑子都成浆糊了……似乎是编码的问题导致的。
于是我在存储数据的时候,加了UTF-8的参数设置。
to_csv(filename, encoding='UTF-8')
结果还是不行,而且在read.csv的时候反而开始报错,大概的意思就是好几个csv的编码不统一,导致无法读取,这个该死的 ’ 符号好像三体投射在我视网膜上的倒计时一样顽固…………
我想了想大概率是在akshare爬去数据的时候数据没有格式化过,处理的不够完美,导致后续一些列麻烦。
后来实在是无可奈何,毕竟鄙人彩笔一枚,也没那个技术含量去修改akshare源码(我要是有这技术,也没必要直接用人家的接口了……),索性直接用xlsx格式,避开这该死的编码问题…………
果然那个符号消失了…………
还真是解决问题最好的方式就是绕过问题…………
这年头自学个数据科学最难的不是编程逻辑,反而是这些鸡毛蒜皮的破事…………真磨人