
数据仓库
文章平均质量分 93
数据仓库、OLAP(联机分析处理)、数据挖掘、商业智能。
不剪发的Tony老师
《SQL编程思想》作者,PostgreSQL ACE。
展开
-
Apache Hive:基于Hadoop的分布式数据仓库
Apache Hive 是一个基于 Apache Hadoop 构建的开源分布式数据仓库系统,支持使用 SQL 执行 PB 级大规模数据分析与查询。原创 2025-03-24 20:00:00 · 1310 阅读 · 0 评论 -
Apache Doris:一款高性能的实时数据仓库
Apache Doris 非常适合用于报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等场景。用户可以基于 Doris 构建大屏看板、用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。原创 2025-02-24 22:00:00 · 1459 阅读 · 0 评论 -
Apache Hop:开源版本的Kettle
Apache Hop 最初来源于我们熟悉的 ETL 工具 Kettle(Pentaho Data Integration),并且在 2020 年成为 Apache 软件基金会的顶级项目。可视化开发,提供了图形界面用于设计工作流(workflow)和数据管道(pipeline),用户可以专注于业务逻辑而不是代码实现。跨引擎支持,工作流和数据管道支持原生 Hop 引擎的本地和远程运行,数据管道也可以通过 Apache Spark、Apache Flink 以及 Google Dataflow 运行。原创 2025-02-22 22:01:06 · 1164 阅读 · 0 评论 -
Kettle:一款数据仓库ETL神器
Pentaho Data Integration(Kettle)是一款功能强大、灵活易用的数据集成工具。它能够高效地处理各种数据类型和数据源,实现数据的抽取、转换和加载。原创 2024-11-18 21:00:00 · 2539 阅读 · 3 评论 -
Oracle 数据仓库 ETL 技术之多表插入语句
本文介绍了 Oracle 数据仓库 ETL 流程中使用的多表插入语句,具体内容涉及了无条件的 INSERT ALL 语句插入多行数据到单个表或者多个表,无条件的 INSERT ALL 语句还实现列转行(PIVOT),有条件的 INSERT ALL 语句实现基于条件的多表插入,有条件的 INSERT FIRST 语句以及多表插入语句的使用限制。原创 2021-04-09 23:36:02 · 2603 阅读 · 7 评论