
数仓与大数据
文章平均质量分 54
数据仓库与大数据技术积累
wzy0623
30年专职DBA工作;OCP Oracle 8i DBA、MySQL 5 DBA、信息系统项目管理师;《Hadoop构建数据仓库实践》、《HAWQ数据仓库与数据挖掘实战》、《SQL机器学习库——MADlib技术解析》、《MySQL高可用实践》、《Kettle构建Hadoop ETL》、《Greenplum构建实时数据仓库实践》作者。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
在 Kettle 里使用快照实现变化数据捕获(CDC)
在 Kettle 里使用快照实现变化数据捕获(CDC)原创 2016-12-26 15:06:13 · 6092 阅读 · 0 评论 -
参加 BDTC 2016 有感
参加 BDTC 2016 有感原创 2016-12-11 20:37:50 · 1646 阅读 · 1 评论 -
ETL 主流程(书摘备查)
ETL 主流程原创 2016-12-27 09:54:21 · 1145 阅读 · 0 评论 -
ETL 会话期流程(书摘备查)
ETL 会话期流程原创 2016-12-27 09:55:26 · 788 阅读 · 0 评论 -
Hive 实现自增列的两种方法
Hive 实现自增列的两种方法:row_number() 与 UDFRowSequence原创 2016-12-27 10:02:46 · 57149 阅读 · 0 评论 -
Hive 进行身份证合法性校验
Hive 进行身份证合法性校验原创 2016-12-27 10:10:07 · 9326 阅读 · 5 评论 -
四种 CDC 方案比较
四种 CDC 方案比较:时间戳;快照;触发器;日志原创 2016-12-27 16:05:20 · 26952 阅读 · 1 评论 -
数据仓库模型开发方法学(书摘备查)
数据仓库模型开发方法学(书摘备查)原创 2016-12-28 11:34:22 · 1168 阅读 · 0 评论 -
关系模型与多维模型差异示例(书摘备查)
关系模型与多维模型差异示例(书摘备查)原创 2016-12-28 11:37:42 · 1242 阅读 · 0 评论 -
生成全局 ID
使用 auto_increment_increment 和 auto_increment_offset、创建全局 ID 表、使用 memcache、批量分配编号、使用复合值、使用双字段 auto_increment 键、使用 GUID原创 2016-12-28 15:00:49 · 681 阅读 · 0 评论 -
存储过程实现递归算法
Oracle、MySQL 存储过程实现递归算法原创 2016-12-28 15:08:59 · 6320 阅读 · 0 评论 -
日期差的天时分秒表示 SQL
日期差的天时分秒表示 SQL原创 2016-12-28 15:11:20 · 1292 阅读 · 0 评论 -
联机分析处理简介
OLAP 的概念、OLAP 的多维数据概念、OLAP 的多维数据结构、多维数据库原创 2016-12-28 15:29:47 · 2782 阅读 · 0 评论 -
多维数据库的选择
多维数据库简介、现有多维数据库相关分类、简要比较原创 2016-12-28 15:34:22 · 7754 阅读 · 0 评论 -
云计算背后的秘密:NoSQL 数据模型与 CAP 理论
云计算背后的秘密:NoSQL 数据模型与 CAP 理论原创 2016-12-28 16:15:48 · 764 阅读 · 0 评论 -
星型和雪花型模式
星型和雪花型模式原创 2016-12-29 08:58:21 · 1604 阅读 · 0 评论 -
海量数据查询优化
海量数据查询优化原创 2016-12-29 09:25:07 · 958 阅读 · 0 评论 -
数据仓库与传统数据库的比较
数据仓库与传统数据库的比较原创 2016-12-29 10:45:33 · 2779 阅读 · 0 评论 -
开发数据仓库模型的方法学(书摘备查)
开发数据仓库模型的方法学(书摘备查)原创 2016-12-29 10:46:59 · 926 阅读 · 0 评论 -
数据质量的六大评估标准(书摘备查)
数据质量的六大评估标准(书摘备查)原创 2016-12-29 10:54:54 · 16974 阅读 · 1 评论 -
BI 领先的厂商
BI 领先的厂商原创 2016-12-29 10:56:55 · 1170 阅读 · 0 评论 -
ODS 与数据仓库的区别
ODS 与数据仓库的区别原创 2016-12-29 11:12:52 · 2050 阅读 · 0 评论 -
数据仓库建模与数据库建模的比较
数据仓库建模与数据库建模的比较原创 2016-12-29 11:29:01 · 2723 阅读 · 0 评论 -
商业智能的基本概念
商业智能是什么、商业智能都能用来做什么、典型的商业智能项目实施流程原创 2016-12-29 11:33:38 · 2786 阅读 · 0 评论 -
建立标准数据对照表
建立标准数据对照表原创 2016-12-29 13:05:23 · 2404 阅读 · 0 评论 -
DW、OLAP、DM、DSS 的关系
DW、OLAP、DM、DSS 的关系原创 2016-12-29 13:21:27 · 4163 阅读 · 0 评论 -
什么是 ODS
ODS 的定义、为什么需要 ODS原创 2016-12-29 13:55:33 · 7289 阅读 · 0 评论 -
HAWQ 中的行列转置
固定列数的行转列、不定列数的行转列、单行变多行、多列转多行原创 2017-06-21 17:11:26 · 1429 阅读 · 0 评论 -
一个有趣的时间段重叠问题
问题描述、问题分析、实现及测试原创 2018-01-24 17:09:55 · 4905 阅读 · 0 评论 -
快速生成日期维度数据
方法一:平凡低效(9分钟);方法二:高效迭代(5秒);方法三:一次生成(1秒)原创 2019-04-06 08:38:32 · 4782 阅读 · 5 评论