数据分析
快乐的冲浪码农
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于北京二手房价数据的探索性数据分析和房价评估——房价评估模型构建
数据分析项目——北京二手房价数据分析第一步:获取数据(在这里获取这个实验的数据集!!)第二步:数据读取和数据预处理第三步:数据的可视化分析第四步:构建房价评估模型(决策树、随机森林等)文章目录1 数据预处理1.1 分解户型列1.2 特征选取1.3 分类数据转换2 数据特征相关性分析3 建立模型3.1 划分数据集3.2 决策树模型学习曲线构建模型决策树可视化3.3 随机森林学习曲线构建模型3.4 k-近邻模型4 测试4.1 测试用例4.2 测试1 数据预处理1.1 分解户型列通过上述分析,原创 2020-11-20 20:47:04 · 3568 阅读 · 4 评论 -
基于北京二手房价数据的探索性数据分析和房价评估——数据的可视化分析
文章目录1 区域因素1.1 各区域内二手房的分布情况1.2 各区域内二手房的单价情况1.3 各区域内二手房的总价情况2 小区因素2.1 小区房源数量分布2.2 小区总房价对比3 面积因素3.1 各个面积区间内房屋的数量3.2 面积与房屋总价的关系4 户型因素4.1 户型统计4.2 户型与总价的关系5 热度、观看人数因素5.1 热度因素5.2 观看人数因素6 发布时间因素6.1 不同发布时间的房屋数量6.2 不同发布时间的房屋总价由于图表分析无法更加直观的分析各个因素与房屋价格的关系,因此在进行数据的预处原创 2020-11-20 20:34:22 · 3706 阅读 · 2 评论 -
基于北京二手房价数据的探索性数据分析和房价评估——数据的读取和预处理
文章目录1 读取数据1.1 导入数据1.2 列重命名2 数据预处理2.1 统一数据格式2.2 数据列的拆分2.3 处理缺失值2.4 处理重复值1 读取数据在本阶段需要导入数据集中的数据,并且对数据进行初步观察,为了方便后续的操作,对数据集中的中文字段进行修改。1.1 导入数据使用pandas的.read_csv方法读取数据集bj.csv,编码方式为gbkdata = pd.read_csv('./数据集/bj.csv', encoding='gbk')1.2 列重命名data = data.原创 2020-11-20 19:51:26 · 1553 阅读 · 0 评论 -
基于北京二手房价数据的探索性数据分析和房价评估——项目设计和数据的获取
数据分析项目——北京二手房价数据分析第一步:获取数据(在这里获取这个实验的数据集!!)第二步:数据读取和数据预处理第三步:数据的可视化分析第四步:构建房价评估模型(决策树、随机森林等)下载地址:...原创 2020-11-20 20:49:47 · 1360 阅读 · 2 评论 -
【速查手册】Pandas........(持续更新)
记录一些使用频率较高的,便于查阅文章目录Pandas1、关键缩写和包导入2、导入数据3、导出数据4、创建测试对象5、查看、检查数据6、数据选取7、数据清理8、数据处理:Filter、Sort和GroupBy9、数据合并10、数据统计Pandas1、关键缩写和包导入在这个速查手册中,我们使用如下缩写:df:任意的Pandas DataFrame对象s:任意的Pandas Series对象同时我们需要做如下的引入:import pandas as pdimport numpy as n.原创 2020-11-07 10:51:40 · 178 阅读 · 0 评论
分享