
大数据
文章平均质量分 94
清风和月明
这个作者很懒,什么都没留下…
展开
-
维度建模方法论
维度建模方法一、前言本人学习《数仓工具箱》的学习总结,纯学习分享,供大家参考。二、经典数仓架构理论围绕着维度建模,那就不得不了解,早期的数据仓库构架方法。这里介绍一下两个经典的数仓架构理论。2.1、Kimball模式Kimball 模式从流程上看是是自顶向下的,即从数据集市到数据仓库再到数据源(先有数据集市再有数据仓库)的一种敏捷开发方法。对于Kimball模式,数据源每每是给定的若干个数据库表,数据较为稳定但是数据之间的关联关系比较复杂,须要从这些OLTP中产生的事务型数据结构抽取出分析型原创 2022-02-11 15:37:03 · 3582 阅读 · 1 评论 -
hdfs
HDFS一、HDFS概述1.1、HDFS产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS 只是分布式文件管理系统中的一种。1.2、HDFS概念HDFS(Hadoop Distributed File System),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。H原创 2021-04-15 10:19:14 · 340 阅读 · 0 评论 -
Hadoop入门
Hadoop入门一、概念二、环境准备三、Hadoop生产集群搭建一、概念1.1、Hadoop是什么Hadoop 是一个由Apache基金会所开发的分布式系统基础架构 。主要解决海量数据的存储和海量数据的分析计算问题广义上来说,Hadoop 通常是指一个更广泛的概念———Hadoop生态圈(HBase、Hive等)1.2 、Hadoop发展历史Hadoop创始人 Doug Cutting ,为了实现与 Google类似的全文搜索功能,在Lucene框架基础上进行优化升级,查询引擎原创 2021-04-12 17:14:41 · 288 阅读 · 0 评论