
大数据
文章平均质量分 85
未来二十年发展的核心技术之一:大数据
i阿极
数据分析优质创作者、华为云社区专家博主,工作和研究方向为数据分析、机器学习、爬虫,持续分享学习文章,感谢关注和支持。专栏《机器学习案例》感兴趣的小伙伴速速订阅,资源有对应数据可下载。
服务至上:爬虫|期末作业|课程项目|商务合作
展开
-
Spark Local模式安装(保姆式详细教程附代码)
(详细教程附代码)了解Spark的六种运行模式,准确理解Spark Local模式运行原理,熟练掌握Spark Local模式的安装流程。原创 2023-01-07 21:15:52 · 1538 阅读 · 0 评论 -
Hive分区&分桶
结合实验(附详细代码)了解分区与分桶,Hive分区是为了方便数据管理,Hive实际存储在HDFS上的抽象,Hive的一个分区名对应一个目录名,子分区名就是子目录名,并不是实际的一个字段,所以当我们在插入数据的时候后指定分区,其实就是新建一个目录或者子目录,或者在原有的目录上添加数据文件。Hive创建分区时是通过PARTITIONED BY关键字进行创建。Hive分桶是指分通表的某一列,让该列数据按照哈希取余的方式随机,均匀的分发到各个桶文件中。原创 2023-01-07 09:30:00 · 751 阅读 · 0 评论 -
Hive查询函数
附有详细代码 实验目的:1、学会使用Hive内置函数 2、学会使用Hive统计分析原创 2022-12-26 22:01:25 · 596 阅读 · 0 评论 -
Hive分组排序
1.了解Hive中Order by 、Sort by的用法以及区别2.了解Hive中Distribute by、Group by以及Cluster by的用法于区别原创 2023-01-06 09:30:00 · 1546 阅读 · 0 评论 -
Hive本地模式安装(详细)
本地模式安装采用外部数据库存储元数据,该模式不需要单独开启Metastore服务,因为本地模式使用的是和Hive在同一个进程中的Metastore服务。原创 2022-12-01 13:59:47 · 3323 阅读 · 0 评论 -
Hive 查询
1.掌握Hive的普通查询、别名查询、限定查询与多表联合查询。2.掌握Hive的多表插入、多目录输出以及使用Shell脚本查看Hive中的表。原创 2023-01-02 11:37:25 · 724 阅读 · 0 评论 -
Flume多source,多sink组合框架搭建
1.了解Flume数据传输原理2.了解Flume的配置文件3.了解Flume采集与投递数据的框架搭建原创 2022-12-28 16:31:33 · 1117 阅读 · 0 评论 -
MapReduce 编程基础 -- topn
MapReduce 编程基础 -- topn原创 2022-11-16 10:55:38 · 384 阅读 · 0 评论