Q1:用python3读csv文件,出现UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd0 in position 0: invalid con
A1:文件不是 UTF8 编码的,而系统默认采用 UTF8 解码。解决方法是改为对应的解码方式。用记事本打开文件另存为UTF-8格式即可。
Q2:FutureWarning: using a dict on a Series for aggregation is deprecated and will be removed
aggResult = df.groupby(by='年龄分层')['年龄'].agg({'人数': numpy.size})
A2:pandas提示警告不建议只用这种用法,最新的用法是
方法1:
aggResult = df.groupby(by='年龄分层')['年龄'].agg(['size'])
aggResult.columns=['人数']
方法2:
aggResult = df.groupby(by='年龄分层')['年龄'].agg(['size']).rename(columns={'size': '人数'})
Q3:ValueError: You are trying to merge on int64 and object columns. If you wish ...
A3:on字段的数据类型必须一致
failed= pandas.merge(
failed,
student,
how='left',
on=['学号'],
sort=True
)
Q4:matplotlib 图片出现了第一次和第二次图片的重叠
A4:每次plt.savefig后需要plt.close(),因为每次保存后依然有数据留在缓冲区,所以下次更新的时候,会加上上次的图片数据导致图片的重叠,所以需要每次保存后,需要plt.close()清空一下