- 博客(7)
- 收藏
- 关注
原创 Linux环境下安装Anaconda
如果安装包名为Anaconda3-xxxx.xx-Linux-x86_64.sh,则执行chmod +x Anaconda3-xxxx.xx-Linux-x86_64.sh。
2024-10-24 09:23:20
1056
原创 Apache Hive使用语法与概念原理
数据仓库和数据库是两种不同的数据存储系统,它们有以下几点区别:数据结构和用途:数据库通常用于存储和管理实时操作数据,例如交易记录、用户信息等。而数据仓库则用于存储大量历史数据,用于分析和决策支持。数据处理方式:数据库通常采用OLTP(在线事务处理)方式,用于处理实时的交易数据。而数据仓库通常采用OLAP(在线分析处理)方式,用于支持复杂的数据分析和查询。数据量和性能:数据仓库通常存储大量的历史数据,需要支持复杂的查询和分析操作,因此通常需要更大的存储空间和更高的性能要求。
2024-04-24 20:00:15
720
原创 简单认识Hive
Hive是一个开源的数据仓库工具,用于在Hadoop平台上进行数据查询和分析。它是基于Hadoop的。因此,从本质上来看,Hive是将SQL转换为MapReduce程序的工具。因为,比直接用MapReduce开发效率更高,Hive的主要作用就是用来做离线数据分析。
2024-04-23 19:26:42
393
2
原创 Hadoop-HDFS文件系统
➢ 安装好hadoop环境之后,可以执行hdfs相关的shell命令对hdfs文件系统进行操作,比如文件的创建、删除、修改文件权限等。➢ 对HDFS的操作命令类似于Linux的shell对文件的操作,如ls、mkdir、rm等。
2024-04-23 18:18:27
1154
原创 初识Hadoop
(1).单点故障:中心节点是系统的核心,一旦中心节点出现故障,整个系统可能会崩溃;(2).扩展性受限:中心化模式的扩展性受限于中心节点的性能,难以实现大规模的系统扩展;(3).安全隐患性:中心节点成为攻击者的目标,一旦中心节点被攻击,整个系统的安全性都会受到威胁;在中心化模式中,系统 通常有一个中心节点或中心服务器,其他节点或用户都围绕这个中心节点进行操作和通信。集群是指一组独立的计算机系统构成的一多处理系统,它们之间通过网络实现进程间的通信,让若干台计算机联合起来工作,可以是并行的,也可以是做备份。
2024-04-22 20:06:53
1114
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人