- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 Doris的Join优化
如果一个 A 表经常需要用某个固定字段 K,来跟 B 表进行关联查询,则我们可以把 K 定义为 A 表的分桶字段,这样一来,当 Join 的等值表达式命中了 A 的数据分布列,Doris 底层就会将 Join 的执行计划解析为:Bukect shuffle join。则,这些表的桶数都相同,桶中的数据都按照join条件列拥有相同的数据分布规律,且各表的相同桶号的桶都会落在相同的BE节点上;(那么,这些表的相同桶号的桶,就会被存放在相同的BE节点上,JOIN时完全不需要网络传输)。
2024-05-08 11:21:57
940
原创 Elastic Search原理:什么是倒排索引?
记录词条所在的文档ID,查询词条时,直接查询改词条的文档ID,然后得到该文档(该条数据)。答:基于表中字段(往往为主键ID)创建的索引,若想查询。,必须去做全表匹配,并且使用。问:什么是正向索引?问:什么是倒排索引?
2024-05-08 00:32:52
142
原创 Hive查询报错:FAILED:Execution Error,return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
在Linux命令行中泡HiveSQL统计行数,但每次统计出来都为0,后来发现是查询语句压根就没执行。
2024-04-19 21:52:14
1179
1
原创 Vmware下Ubuntu安装Vmware tools分辨率/屏幕显示不全问题
解决VMware下Ubuntu分辨率问题 / 点不到分辨率应用按钮 / 安装VMware Tools
2023-03-02 15:37:35
1618
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人