starRocks
文章平均质量分 87
wrr-cat
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
第2.9章:StarRocks表设计--Colocation Join
Colocation表的副本分布需要遵循Group中指定的分布,所以在副本修复和均衡方面和普通分片有所区别,前面使用show语句查看Group信息时,我们需要关注其中的IsStable属性,当值不为true时,表示当前Group内有部分表的分片正在做修复或迁移,此时,相关表的Colocation Join将退化为普通Join,在explain join sql时提示:colocate: false, reason: group is not stable。如果满足,则会创建该表,并将该表加入Group。原创 2023-04-03 21:01:30 · 396 阅读 · 0 评论 -
第2.8章:StarRocks表设计--物化视图
StarRocks的物化视图对用户是隐式的,当我们查询时,并不需要感知物化视图的存在,也不必显式的指定物化视图的名称,查询优化器会根据查询条件自动判断是否可以路由到相应的物化视图并选择最佳的MVs表,然后重写查询计划进行最优查询。补充几个概念,我们将table1-table11这样的OLAP表称为Base表(或基表),基于Base表我们可以创建物化视图表(MVs表),物化视图的数据组织形式(分区、分桶、存储等)和Base表相同,但物化视图拥有单独的前缀索引。5、单表上过多的物化视图会影响导入的效率。原创 2023-04-02 00:55:52 · 1398 阅读 · 0 评论 -
第2.7章:StarRocks表设计--视图
StarRocks也拥有视图功能,且其与MySQL中的视图概念及语法非常类似。StarRocks中的视图也是一种虚拟存在的表,其行和列的数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的,只保存了sql逻辑,不保存查询结果。2。原创 2023-04-01 23:51:46 · 850 阅读 · 0 评论 -
第2.6章:StarRocks表设计--列级别索引
支持列级别的索引技术,比如,Bitmap索引适合低基数列,可以快速计算出枚举类型的列满足一定条件的行。Bloomfilter索引用于高基数列,可快速判断数据块中不含所查找值。在入门阶段,我们不需要研究实现原理,可以先明确它们的使用场景,并尝试实践应用。原创 2023-04-01 23:34:48 · 541 阅读 · 0 评论 -
第2.5章:StarRocks表设计--数据类型
StarRocks支持多种类型,大致可以分为:数值、时间、字符以和其他类型。原创 2023-03-31 17:32:47 · 602 阅读 · 0 评论 -
第2.4章:StarRocks表设计--分区分桶与副本数
StarRocks采用Range-Hash的组合数据分布方式,也就是我们一直在提的分区分桶方式。原创 2023-03-31 17:08:52 · 3943 阅读 · 0 评论 -
第2.3章:StarRocks表设计--排序键和前缀索引
在介绍StarRocks的四种数据模型时,我们多次提到了排序键,也列出了一些排序键的注意事项,现在咱们来一起研究下到底什么是排序键。原创 2023-03-31 16:15:32 · 627 阅读 · 0 评论 -
第2.2章:StarRocks表设计--数据模型
为了全面的满足企业业务上的分析需求,StarRocks当前设计了四种数据模型:明细模型、聚合模型、更新模型、主键模型。原创 2023-03-31 15:55:53 · 533 阅读 · 0 评论 -
第1.5章:StarRocks部署--集群部署
StarRocks作为新一代MPP数据库,集群部署才能充分发挥其彪悍的查询性能。生产环境下我们也推荐进行集群化部署,本章内容我们就模拟生产环境下StarRocks集群部署。在中我们已经介绍了版本选择时的注意事项,这里我们以从StarRocks官网下载的1.19.3社区版为例进行部署,下载地址:StarRocks - 新一代极速全场景MPP数据库新一代极速全场景MPP数据库,速度提升100倍!原创 2023-03-31 14:25:28 · 811 阅读 · 0 评论 -
第2.1章:StarRocks表设计--概述
我们将table01的数据副本指定为了1,而在不指定时,StarRocks默认为三副本数据(这里的副本数与ElasticSearch等的含义不同,StarRocks的1副本意思是仅有一份数据,三副本为共有三份数据)。提前说明一下,在默认情况下,这里的属性是针对全表的,但是,StarRocks也支持针对分区级别单独设置一些属性,这里咱们也暂不展开。这里是为聚合模型显式的定义排序键,在为聚合模型定义排序键时,需要把所有的维度列按照建表的顺序都写上。bitmap索引我们也可以在建表完成后再创建,这里暂不展开。原创 2023-03-31 15:38:26 · 586 阅读 · 0 评论 -
第1.4章:FE开发环境搭建(拓展篇)
不同于一般的Maven类的项目,若我们直接从git中获取代码放入IDEA中是跑不起来的,我们需要先在StarRocks工程中手动运行maven命令生成一些Java代码来加入到FE工程中用于后续IDEA的编译。在Windows环境下,部分make命令和sh脚本可能无法执行,所以我们可以先在Docker镜像中进行StarRocks的编译,编译的过程中同样会生成那些我们需要用到的Java文件。再次提示:FE启动后会将当前的ip信息写入本地文件中,若ip改变会无法正常启动,所以务必要将本机的ip配置为。原创 2023-03-31 13:11:29 · 335 阅读 · 0 评论 -
第1.3章:StarRocks部署--单机部署
严格来说,StarRocks并没有所谓的“Standalone运行模式”,生产环境下更是进行单实例部署。这里将单机部署整理出来,主要是考虑当用户,那么也可以在一台机器上简易部署把StarRocks跑起来。以服务器“starrocks(192.168.110.98)”为例,在进行完“第1.2章:StarRocks部署--部署环境准备”中的准备工作后,我们开始进行单节点的部署。为方便演示,我们使用root用户通过XShell工具访问服务器,单节点架构设计如下:机器节点部署服务1 BE。原创 2023-03-31 12:38:41 · 1493 阅读 · 0 评论 -
第1.2章:StarRocks部署--部署环境准备
同时,由于当前StarRocks运行时会将集群内各实例绑定的IP等信息存储于本地目录中,若服务器节点内网IP改变,集群实例将无法正常运行(或需要通过较为繁琐的元数据恢复等操作进行处理),故运行StarRocks的服务器IP(内网)需要是固定的。配置IP前需要注意虚拟机中当前系统的网络适配器设置是“桥接模式”还是“NAT模式”,两者的区别可以简单理解为桥接模式下虚拟机系统可被同局域网内的其他电脑访问到,NAT模式仅可被安装虚拟机的那台宿主机访问,所以在配置IP时就需要留意不同模式下的网关信息。原创 2023-03-31 12:11:39 · 1208 阅读 · 0 评论 -
第1.1章:StarRocks部署--源码编译
如果用户的数据规模不大,上图中的业务架构还可以进一步简化。比如我们就不用再搭建架构较重的Hadoop集群,也不需要再使用Flink等外部计算框架,而是直接使用Kafka作为缓冲,在外部数据进入Kafka后通过StarRocks自带的Routine Load流式拉取数据,来将所有的原始数据直接存放在StarRocks中。下图就是一个常见的大数据业务架构图,StarRocks在整个大数据架构中一般会处在比较靠上的位置,我们会将数据ETL后导入至StarRocks,而后提供给上层的各类业务系统进行展示和分析。原创 2023-03-31 11:23:23 · 442 阅读 · 0 评论 -
第0章:初识StarRocks
如果用户的数据规模不大,上图中的业务架构还可以进一步简化。比如我们就不用再搭建架构较重的Hadoop集群,也不需要再使用Flink等外部计算框架,而是直接使用Kafka作为缓冲,在外部数据进入Kafka后通过StarRocks自带的Routine Load流式拉取数据,来将所有的原始数据直接存放在StarRocks中。下图就是一个常见的大数据业务架构图,StarRocks在整个大数据架构中一般会处在比较靠上的位置,我们会将数据ETL后导入至StarRocks,而后提供给上层的各类业务系统进行展示和分析。原创 2023-03-30 22:13:21 · 479 阅读 · 0 评论
分享