
hive
乄浅醉
这个作者很懒,什么都没留下…
展开
-
Hive 学习笔记(一)
DataType 数据类型hive支持以下数据类型:有符号整数: BIGINT(8 字节),INT(4字节),SMALLINT(2字节)、TINYINT(1字节)浮点数:FLOAT 、 DOUBLEBOOLEAN:FLASE、TRUESTRINGMAP:无序键值对。键的类型必须是原子的,值可以是任意类型,同一个映射的键的类型必须相同,值的类型也必须相同ARRAY: 有序列表,所有元素都必原创 2016-06-24 14:57:50 · 637 阅读 · 0 评论 -
Hive 学习笔记 (二)
存储格式Hive从两个维度对表的存储进行管理: row format 和 file format。 row format 指 行和一行中的字段如何存储。对于Hive来说,row format的定义由SerDe定义。查询表时,SerDe 把文件中字节形式的数据行反序列化为Hive内部操作数据行时所使用的对象形式。执行Insert 或者CTAS 时,表的SerDe会把Hive的数据行内部表示形式序列化成原创 2016-06-24 18:27:06 · 5572 阅读 · 0 评论 -
Hive 学习笔记(三)
自定义函数当写hive UDF时,有两个选择:一是继承 UDF类,二是继承抽象类GenericUDF。这两种实现不同之处是:GenericUDF 可以处理复杂类型参数,并且继承GenericUDF更加有效率,因为UDF class 需要HIve使用反射的方式去实现。UDF一个UDF 必须满足两个条件: 1. 必须继承 org.apache.hadoop.hive.ql.exec.UDF类 2.原创 2016-06-27 18:48:30 · 2278 阅读 · 0 评论