
python
MelindaZhong
这个作者很懒,什么都没留下…
展开
-
pandas计算结果插入到MYSQL中报错-error 1054 UNKNOW COLUMN
问题描述如上图,将表导入到Mysql中报错。查看了计算的Dataframe 和 mysql表字段都不包含inf这个名字的字段。所以网上那些可能是写错了列名、包含了空格等原因都排除。问题分析最后把计算的结果输出到excel,查找inf这个词,发现确实存在。其实自己没仔细看,之间用df.sample也出现了inf。仔细看是因为利润率=利润/成本,数据中成本为0 的情况导致inf的出现。解决方案成本为0其实是异常数据,应该在前序的数据清洗中就剔除或是填充。遗留问题:是否可以直接跳过成本为0 的行.原创 2020-09-20 14:37:33 · 816 阅读 · 0 评论 -
python处理链家数据项目总结
项目背景数据来自某课程老师教学案例数据,目标是根据数据对北京市房价进行分析,获取单价、单价的周走势、成交数量的周走势等信息。项目中遇到的问题及应对数据读取部分已经写在上一篇博客中python读取csv报错数据清洗部分Q1. 缺少关于地区的信息。其实是原始数据将大区信息放在该区域数据之前单独一行。复制含有地区信息的列查看该列数据特点:除了有用的数据外都是数值用空值替代数值用地区...原创 2020-04-07 14:28:55 · 566 阅读 · 0 评论 -
python项目练习--链家房价分析
import numpy as npimport pandas as pdimport matplotlib as mpl # 注意此处的引用不要漏掉,否则下面的中文显示设置报错import matplotlib.pyplot as pltimport warningswarnings.filterwarnings('ignore')mpl.rcPa...原创 2020-04-07 14:25:26 · 1402 阅读 · 2 评论 -
python读取csv报错
python读取csv文件报错数据:链家分区汇总.csv说明:该数据非官方数据,不具有真实使用价值,仅作为学习素材使用思路如下:读取报错initializing文件名中文导致错误修改文件名为英文增加编码及引擎信息先open后读取UnicodeDecodeError:gbk...**总结:文件名为中文名会导致读取失败。日常工作中最好使用英文名作为文件名。读取文件样成指定engine,...原创 2020-04-02 13:58:59 · 1775 阅读 · 1 评论