
Hive
文章平均质量分 79
Hive相关内容
hsukk17
为了自己 请你努力
展开
-
数仓项目环境搭建
搭建数仓项目环境涉及多个组件和工具的安装与配置,每个步骤都至关重要。本文介绍了从JDK安装、Hadoop、Hive的搭建,到数据采集工具Flume、数据同步工具DataX以及调度工具DS的完整流程。通过这些工具的协同工作,可以实现高效稳定的数据仓库环境。原创 2024-09-18 11:39:25 · 1492 阅读 · 0 评论 -
Hadoop-HDFS安装及分布式集群搭建详解
本文介绍了如何在Linux环境下安装Hadoop HDFS,并进行了简单的单节点和多节点分布式集群搭建。通过配置Hadoop的核心文件、格式化NameNode、启动HDFS集群,我们可以顺利搭建一个高可用、高容错的HDFS分布式文件系统。HDFS是Hadoop生态系统的基石,熟练掌握其安装及配置是大数据处理的基础。原创 2024-09-11 06:00:00 · 2937 阅读 · 0 评论 -
Linux自定义实用脚本
需要有一个服务rsync,在所有的分发的电脑上安装 rsync。(赋权限:chmod u+x xsync.sh)集群文件分发脚本(scp -r 文件或者文件夹 root@主机名:/路径)(所有的自定义的脚本文件,存放在/usr/local/bin 下面)命令同步执行脚本(赋权限:chmod u+x xcall.sh)查看整个集群的服务启动情况。原创 2024-09-10 16:00:00 · 441 阅读 · 0 评论 -
在 Hive SQL 中判断字段是否包含指定字符串的几种方法
在SQL中,判断一个字段是否包含特定数据的方法有很多,常见的方式有LIKE、IN、FIND_IN_SET(MySQL)等。原创 2024-11-05 10:32:57 · 1511 阅读 · 0 评论 -
Hive 查询用户连续三天登录的所有记录
本文将介绍如何使用 Hive SQL 查询出用户连续三天登录的记录。我们将通过一个示例表 user_log 来说明实现步骤,包括如何拆分数据、判断连续性、以及最终生成符合条件的完整结果。原创 2024-11-07 20:20:23 · 1274 阅读 · 0 评论 -
Hive 查询各类型专利 Top 10 申请人及对应的专利申请数
通过本文,我们学习了如何使用 Hive 的 SQL 来拆分多值字段并进行分组统计和排名。该方法适用于类似包含多值字段的分析需求,能够帮助我们快速得到各类型专利的 Top 10 申请人,为数据分析和决策提供支持。原创 2024-11-07 19:57:50 · 937 阅读 · 0 评论