- 博客(10)
- 收藏
- 关注
原创 Hive环境安装
进入Hive配置文件目录:apache-hive-4.0.0-bin/conf。命令行运行: hive --version。,下载完成后解压缩,放置到想要安装的目录下。
2024-10-29 18:43:57
329
原创 Spark环境安装
进入Spark配置文件目录:spark-3.5.3-bin-hadoop3/conf。命令行运行:spark-shell。,下载完成后解压缩,放置到想要安装的目录下。访问Spark UI。
2024-10-25 18:53:21
675
原创 Hadoop环境安装
进入Hadoop配置文件目录:hadoop-3.4.0/etc/hadoop/,下载完成后解压缩,放置到想要安装的目录下。,查看是否有如下进程。
2024-10-24 16:05:42
655
原创 Flume-Kafka
其中包括 Source、Channel、Sink。:源和接收器之前的管道,接收 Source 的数据转发给 Sink,临时数据存储。从 Channel 中读取数据,并存入外部存储系统或转发到下一个Source。是一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。每个文件只读取一遍,读取完成文件后缀增加标识。:一个JVM进程,以事件的形式将数据从源头传输到目的地。:数据收集组件,读取外部数据存储到Channel。
2024-10-11 18:05:32
916
原创 SQL_窗口函数
使用说明:row_number() over(分组字段 排序字段)分组字段,排序字段 非必填。使用说明:sum(聚合字段) over(分组字段 排序字段)使用说明:函数(聚合字段) over(分组字段 排序字段)使用说明:函数(聚合字段) over(分组字段 排序字段)使用说明:函数(聚合字段) over(分组字段 排序字段)使用说明:函数(字段,n) over(分组字段 排序字段)使用说明:函数(分桶数) over(分组字段 排序字段)使用说明:rank() over(分组字段 排序字段)
2024-06-06 11:22:30
879
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅