作业题目
- 读取lianjia.csv文件里的数据
- 观察结构,调整列索引顺序(Region",“Garden”,“Layout”,“Floor”,“Year”,“Size”,“Elevator”,“Direction”,“Renovation”,“Price”)
- 增加一个列关于目前状况(state),是否卖出状态随机设定
- 查找楼层低的房子(这里提取低楼层)
- 电梯这列存在缺失值,想办法处理下缺失值
作业答案
第一题
代码
import numpy as np
import pandas as pd
lianjia_data = pd.read_csv('..\数据\lianjia.csv', encoding='utf-8', engine='python')
lianjia_data
lianjia_data.info()
执行效果

第二题
- 观察结构,调整列索引顺序(Region",“Garden”,“Layout”,“Floor”,“Year”,“Size”,“Elevator”,“Direction”,“Renovation”,“Price”)
代码
lianjia_data_1 = lianjia_data.reindex(columns=["Region","Garden","Layout","Floor","Year","Size","Elevator","Direction","Renovation","Price"])
lianjia_data_1.head()
执行效果

第三题
- 增加一个列关于目前状况(state),是否卖出状态随机设定
代码
lianjia_data_1['state'] = np.random.choice(['未售', '已售'], size=(1710))
lianjia_data_1.head()
执行效果

第四题
代码
lianjia_data_2 = lianjia_data_1['Floor'].str.contains('低')
lianjia_data[lianjia_data_2].head()
执行效果

第五题
代码
lianjia_data.dropna().head()
执行效果
