Hadoop综合项目——二手房统计分析(Hive篇) 文章目录 Hadoop综合项目——二手房统计分析(Hive篇) 0、 写在前面 1、Hive统计分析 1.1 本地数据/HDFS数据导入到Hive 1.2 楼龄超过20年的二手房比例 1.3 四大一线城市各楼层地段的平均价格 1.4 采光较好的二手房比例 1.5 二手房面积大小各个区间的比例 1.6 各大宣传标签的二手房占比 1.7 统计四大一线城市二手房关注人数 1.8 四大一线城市二手房规格比例 2、数据及源代码 3、总结 0、 写在前面 Windows版本:Windows10 Linux版本:Ubuntu Kylin 16.04 JDK版本:Java8 Hadoop版本:Hadoop-2.7.1 Hive版本:Hive1.2.2 IDE:IDEA 2020.2.3 IDE:Pycharm 2021.1.3 IDE:Eclipse3.8 1、Hive统计分析 使用Hive做了7个不同的统计分析,更好地展示二手房的情况 1.1 本地数据/HDFS数据导入到Hive 先创建数据库db_k