本实验将对汽车销售数据进行分析,使用HIVE QL语句来分析统计汽车行业、市场、个人等相关的数据。
准备数据
- 在桌面experiment文件夹中的cars.txt为山西省2013汽车销售数据
- 数据字段说明
时间、销售地点、邮政编码、车辆类型、车辆型号、制造厂商名称、排量、油耗、功率、发动机型号、燃料种类、车外廓长宽高、轴距、前后车轮、轮胎规格、轮胎数、载客数、所有权、购买人相关信息等。
1. 创建数据库(名称:cars)
2 创建外部表(表名:cars、各字段名称和类型请查看数据确定)
- 第一个字段类型为字符串,字段名称:province(描述:省份)
- 第二个字段类型为整型,字段名称:month(描述:月)
- 第三个字段类型为字符串,字段名称:city(描述:城市)
- 第四个字段类型为字符串,字段名称:county(描述:区、县)
- 第五个字段类型为整型,字段名称:year(描述:年)
- 第六个字段类型为字符串,字段名称:cartype(描述:车辆型号)
- 第七个字段类型为字符串,字段名称:productor(描述:制造商)
- 第八个字段类型为字符串,字段名称:brand(描述:品牌)
- 第九个字段类型为字符串,字段名称:mold(描述:车辆类型)
- 第十个字段类型为字符串,字段名称:owner(描述:所有权)