Hive
hikeys
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
HIVE总结1(基础命令+数据类型)
Hive是一种数据仓库,保存了一些半结构化的数据(文本数据)。元数据数据-保存到mysql/debye(默认)数据库中。不支持update和delete语句。 数据必须要保存到hdfs上,依赖于hadoop。 Hive一组类似于SQL的语句-MYSQL,当执行SQL语句 时,对应的生成MapReduce程序。 用于解决:Java程序员开发MapReduce的难点,会SQL就可以开发MapR...原创 2018-08-11 17:22:05 · 3933 阅读 · 0 评论 -
Hive总结2(分区+分桶+查询)
Hive是一个数据仓库 ,保存的半结构化数据 文本。 Hive不支持:事务,不支持索引(但可以通过分桶实现快速的查询,hash) 类似的分布的nosql(Not Only Sql数据库:hbase - Phoinex(凤凰) Hive的功能,就是做mapreduce。 分区: 就是在可控制的情况下,将数据放到不同的目录下。 减小查询的范围。 并不能加快查询的速度。还是要查询所...原创 2018-08-11 17:32:01 · 4574 阅读 · 0 评论 -
Hive总结3(自定义函数,jdbc连接)
1.自定义UTF函数 举例:实现add()函数 1.继承一个类:UDF 2.在里面开发多个重载的方法:evaluate() 3.注册这个函数,将打包的jar包放到hdfs上 4.通过create function创建这个函数,drop function删除这个函数,删除后会有缓存,在重新登陆一次。 1.1新建maven项目 添加依赖: <!-- https://mvnrepo...原创 2018-08-13 09:46:32 · 1261 阅读 · 0 评论
分享