
Hadoop
文章平均质量分 94
半间烟雨
这个作者很懒,什么都没留下…
展开
-
大数据技术之Hadoop-Apache Hive使用语法与概念原理
create database if not exists myhive; use myhive; desc database myhive;数据库本质上就是在HDFS之上的文件夹。默认数据库的存放路径是HDFS的:/user/hive/warehouse内 create database myhive2 location '/myhive2';使用location关键字,可以指定数据库在HDFS的存储路径。 drop database my原创 2024-03-07 17:50:09 · 808 阅读 · 0 评论 -
大数据技术之Hadoop-Apache Hive分布式SQL计算平台
对数据进行统计分析,SQL是目前最为方便的编程工具。大数据体系中充斥着非常多的统计分析场景所以,使用SQL去处理数据,在大数据中也是有极大的需求的。MapReduce支持程序开发(Java、Python等)但不支持SQL开发是一款分布式SQL计算的工具,基于Hive为用户提供了分布式SQL计算的能力写的是SQL、执行的是MapReduce3、为什么使用Hive使用直接处理数据所面临的问题使用Hive处理数据的好处。原创 2024-03-04 11:38:22 · 1120 阅读 · 0 评论 -
大数据技术之Hadoop-分布式计算和资源调度
一、分布式计算概述。原创 2024-03-04 09:59:28 · 1215 阅读 · 0 评论 -
大数据技术之Hadoop-分布式文件系统
配置HDFS。原创 2024-03-01 17:39:25 · 1168 阅读 · 0 评论 -
大数据技术之Hadoop-大数据分布式
狭义上:大数据是一类技术栈,是一种用来处理海量数据的软件技术体系。广义上:大数据是数字化时代、信息化时代的基础(技术)支撑,以数据为生活赋能。原创 2024-03-01 11:10:44 · 690 阅读 · 0 评论 -
大数据技术之Hadoop-运行环境搭建
Hadoop 运行环境搭建原创 2024-02-29 14:24:54 · 1883 阅读 · 0 评论