
hive数据库
文章平均质量分 79
华晨鑫科
大数据
数据分析
技能培训
零基础转行
高薪就业
展开
-
【DML语句的操作】
在hive数据库里面,普通的表格只能添加数据,不能对数据执行 update 或者 delete 操作。insert在hive中的用法1.添加简单类型的数据insert into 表名(列名1, 列名2) values(值1, 值2);2.添加复杂类型的数据insert into 表名(列名1, 列名2) select array(), map();3.覆盖/追加 写入表格数据insert overwrite|into table 表名 [partition (分区字.原创 2022-05-25 14:57:19 · 225 阅读 · 0 评论 -
hive数据库分桶表格的基本操作
分桶表对比前面的分区表,分桶表是对数据进行更加细粒度的划分。分桶表将整个数据内容按照某列属性值的哈希值进行区分,使用该哈希值除以桶的个数得到取余数,余数决定了该条记录会被分在哪个桶中。余数相同的记录会分在一个桶里。需要注意的是,在物理结构上,一个桶对应一个文件,而分区表只是一个目录,至于目录下有多少数据是不确定的。应用场景:1.数据抽样在处理大规模数据集时,尤其载数据挖掘的阶段,可以用一份数据验证一下,代码是否可以运行成功,进行局部测试,也可以抽样进行一些代表性统计分析。分桶抽样原创 2022-05-24 19:00:00 · 1659 阅读 · 1 评论