数据仓库
那怪大尾巴狼咯
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
列式存储ClickHouse(二)接口
Click提供了丰富的接口来访问数据库以及数据库管理系统,如下表:接口类型描述httpClickHouse默认提供了HTTP接口,通过http进行数据库和数据库管理系统相关操作。ClickHouse默认监听8123端口(可修改),http接口比其他接口受到更多的限制,但是兼容性更好,文档齐全,上手简单tcpcommand-linejdbcodbcc++ client libaryclient libariesIntegration原创 2020-11-03 11:21:10 · 4003 阅读 · 1 评论 -
列式存储ClickHouse(一)概述
这里写目录标题概述优势特性缺点特性性能安装测试创建表导入数据查询数据ClickHouse,是一个快速,开源,OLAP的数据库管理系统。ClickHouse是列式存储的,支持实时使用SQL的查询生成分析报告。什么场景下使用ClickHouse分析干净,结构合理且不可变的事件或日志流。 建议将每个这样的流放入具有预连接维度的单个宽事实表中。特别是以下场景:网络和应用分析广告网络和实时出价电信电子商务和金融信息安全监控和遥测时间序列商业智能网络游戏物联网概述优势特性真正的面向原创 2020-10-30 16:39:11 · 2448 阅读 · 2 评论 -
列式存储和行式存储
行式存储数据库和列式存储数据库,随着业务深入,技能增长,经常会碰到,今天来理解一下。列式存储(Clolumn-Based)和行式存储(Row-Based)都是相对于对方的,他们的区别是在磁盘的存储方式不同,所以在读写数据时,方式不同,以至于他们的适用场景也都不同。列式存储数据库主要包括:HBase,ClickHouse,HP Vertica(也支持行式存储)行式存储数据库主要包括传统关系型数据库:MySQL,Oracle,DB2,SQLServer因为是磁盘存储方式不同,所以先跳出固有思维来理解,想原创 2020-10-29 16:57:22 · 1836 阅读 · 0 评论 -
数据仓库ETL(二)基本概念
数据治理领域有一些基本名词,数据仓库,数据挖掘,商业智能,数据同步,联机计算等等,下面一起看一下专有的名词。DB(DataBase)数据库,一般指支撑应用的OLTP()DWOLAPDMBIETL原创 2020-08-24 11:01:53 · 456 阅读 · 0 评论 -
数据仓库ETL之DataX(一)简介
简介ETL,使用ETL工具将数据从数据源端(Extracting,Transform,Loading),抽取,传输,加载同步到目标端的过程。dataX是阿里巴巴内部被广泛使用的离线数据同步工具,实现包括MySQL,Oracle,SqlServer,PostgreSQL,HDFS,Hive,ADS,HBase,TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。DataX本身作为数据同步框架,将不同数据源的同步抽象为从源头数据源读取数据的R原创 2020-07-27 10:43:08 · 1896 阅读 · 1 评论
分享