在虚拟机上安装MySQL和Hive

本文详细介绍了如何在虚拟机上安装和配置MySQL以及Hive。首先讲解了Hive的基本概念和适用场景,然后逐步演示了MySQL的下载、安装、配置和启动过程,包括删除默认的MariaDB、设置root密码以及配置远程访问权限。接着,文章展示了Hive的安装步骤,包括解压安装包、配置环境变量、编辑配置文件、初始化元数据以及启动Hive服务。整个过程旨在帮助读者掌握大数据环境下MySQL和Hive的部署技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章目录

零、学习目标

  1. 掌握如何安装配置MySQL
  2. 掌握如何安装配置Hive

一、Hive概述

  • Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取、转化、加载(ETLExtract-Transform-Load ),这是一种可以存储、查询和分析存储在Hadoop 中的大规模数据的机制。Hive 定义了简单的类SQL 查询语言,称为HQL,它允许熟悉SQL 的用户查询数据。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

(一)Hive的SQL - HQL

  • HQL - Hive通过类SQL的语法,来进行分布式计算。Hive会将HQL转换成MapReduce去执行,因此它是基于Hadoop的一种分布式计算框架,底层仍然是MapReduce。本质上还是一种离线大数据分析工具。

(二)数据库与数据仓库

  • 数据库是面向事务处理的,而数据仓库是面向数据分析处理的(面向主题设计的)。数据仓库存储数据是有主题的,比如分析客户的数据,盈利数据等,都是和决策分析相关的数据。
  • 数据库存储的在线数据,而数据仓库存储的是离线数据(历史数据)。
  • 数据仓库的数据来源是异构的,有来自数据库的数据、日志数据、
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

酒城译痴无心剑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值