
Hadoop
文章平均质量分 79
lambda33
Doing more is a learning process!
展开
-
Hive数据分析案例——汽车销售数据分析
HiveQL汽车销售数据分析,一些简单问题求解原创 2022-05-23 17:32:49 · 7072 阅读 · 6 评论 -
Hive建外表操作以及其它修改表操作 hive外表与内表区别
hive创建外表,分区的删除、查看操作,一些插入,重命名和删除操作数据类型map和struct的创建表操作原创 2022-05-09 19:38:17 · 4103 阅读 · 0 评论 -
Hive工作原理和简单查询、筛选数据操作
hive是基于Hadoop的一个数据仓库工具,提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。一些简单查询、筛选数据操作原创 2022-05-09 10:31:46 · 1154 阅读 · 0 评论 -
第3章 Hadoop---hdfs dfs常用命令的使用
HDFS shell常用文件操作命令汇总hdfs dfs文件操作命令原创 2022-03-28 11:17:38 · 4834 阅读 · 0 评论 -
进一步走近HDFS
1.定义HDFS是Hadoop Distribute File System的缩写,它是Google公司的GFS分布式文件系统的开源实现,是Apache Hadoop项目的一个子项目。支持海量数据的存储,成百上千的计算机组成存储集群,HDFS可以运行在低成本的硬件之上,具有的高容错、高可靠性、高可扩展性、高吞吐率等特征,非常适合大规模数据集上的应用。1.1优点数据冗余 ,高容错性 数据自动保存多个副本 副本丢失后,自动恢复 可构建在廉价机器上 流式文件访问 一次性写入,多次读取 保证数据一致性原创 2022-03-17 19:04:17 · 2546 阅读 · 0 评论 -
初始Hadoop技术
Hadoop,分布式数据结构原创 2022-03-07 14:32:57 · 2047 阅读 · 0 评论