1、clickhouse是什么?
ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。
ClickHouse是近年来备受关注的开源列式数据库,主要用于数据分析(OLAP)领域。目前国内社区火热,各个大厂纷纷跟进大规模使用:
今日头条 内部用ClickHouse来做用户行为分析,内部一共几千个ClickHouse节点,单集群最大1200节点,总数据量几十PB,日增原始数据300TB左右。
腾讯内部用ClickHouse做游戏数据分析,并且为之建立了一整套监控运维体系。
携程内部从18年7月份开始接入试用,目前80%的业务都跑在ClickHouse上。每天数据增量十多亿,近百万次查询请求。
快手内部也在使用ClickHouse,存储总量大约10PB, 每天新增200TB, 90%查询小于3S。
在国外,Yandex内部有数百节点用于做用户点击行为分析,CloudFlare、Spotify等头部公司也在使用。
特别值得一提的是:国内云计算的领导厂商阿里云率先推出了自己的ClickHouse托管产品,产品首页地址为云数据库ClickHouse,可以点击链接申请参加免费公测,一睹为快!
问题1:什么是列式数据库
问题2: 什么又是行式数据库,mysql属于列式数据库还是行式数据库?行式数据库和列式数据库有什么区别和应用场景哪?
数据在存储中的基本单位为页,这也是进行数据读取时候基本单位,一次读取就是一次IO操作
行式数据库如何存的?
列式数据库如何存的?
seq 代表的物理连续读取
4K代表的是随机读取
2、clickhouse支持的数据结构有哪些?
1、ClickHouse支持有符号和无符号的整数。
Int8、 Int16、 Int32、Int64
无符号整数UInt<位数>:
UInt8、UInt16、UInt32、UInt64
2、浮点数
ClickHouse支持单精度浮点数和双精度浮点数。
Float32、Float64、Decimal
3、字符串类型
String、FixedString
4、UUID
ClickHouse支持UUID的数据类型。
5、时间类型
ClickHouse支持Date、DateTime和DateTime64三种时间类型。
6、Date
Date只精确到天,不能指定时区。
7、DateTime
DateTime精确到秒,可以指定时区。
8、DateTime64
DateTime64精确到亚秒,可以指定时区。
9、复合类型
10、数组
ClickHouse支持数组数据类型(Array)。
11、元组
ClickHouse支持元组数据类型(Tuple)。
12、枚举
ClickHouse支持枚举数据类型(Enum)。
13、嵌套
ClickHouse支持嵌套数据类型(Nested)。
可以为一个表定一个多个嵌套数据类型字段,但是每个嵌套字段只支持一级嵌套。
嵌套一般用来表示简单的级联关系。
嵌套本质上是一个多维数组。