hive
qq_20488317
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hive简单创建表及传入数据
项目需要:保存ip到地址的映射表 创建表: CREATE TABLE ip_add( ip string, formatted_address string) row format delimited fields terminated by '\t';#用户表示列之间的分隔符是“\t”。 向表中加载存在本地的数据: load data localinpath '文本的本地路径原创 2017-02-24 10:09:36 · 645 阅读 · 0 评论 -
hive 差集
A表idnameagecity1a18beijing2b20beijingB表idschoolcity1mbeijing3nbeijing5psichuan假设两个表的partition是city,现在的需求是求A表中存在而B表中不存在(A-B)的信息,筛选条件是"id"且city='beijing': select A.id from( (select * from A ...原创 2018-04-22 14:35:02 · 626 阅读 · 0 评论 -
hive posexplode
posexplode用法举例A表(shows表示访问过的城市列表,是有序的)idcitys1[tianjin,shanghai,beijing]B表(show表示访问过的城市)idcity1shanghai2sichuan假设现在需求是:判断B表中访问过的城市在A表shows中的位置。 1、由于A表的shows是数组,所以先用posexplode将A表按shows列展开 select * fro...原创 2018-04-22 15:10:50 · 6014 阅读 · 4 评论 -
hive is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [48,46, 48,10]
1、创建表create table if not exists yourtalle(`score` float, `pos` string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '|'; 2、导入数据load data local inpath "***" overwrite into table yourtable; 导入数据格式举例:1...原创 2018-05-18 19:42:28 · 16226 阅读 · 2 评论
分享