- 博客(3)
- 收藏
- 关注
原创 Hive的理论基础
Hive的定义 hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。 MR job的执行过程 一个InputSplit输入到map,会
2017-09-17 20:28:36
313
1
原创 Hive的HQL操作
Hive的简单使用 创建表语句 create table city(province_code int, province_name string, city_code int, city_name string ) row FORMAT delimited fields terminated by ',' lines terminated by '\n'; 如果需要将本地文件加载
2017-09-16 21:30:55
227
原创 欢迎使用优快云-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 离线写博客 导入导出Markdown文件 丰富的快捷键 快捷键 加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2017-09-15 19:57:52
199
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅