
impala
hadoop程序猿
爸爸的爸爸是爷爷
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
impala+kudu优化
打开网易云,准备tnd哭 目录 1.timestamp类型 2.统计信息 3.看懂执行计划 4.临时表使用parquet 5.join方式&join顺序 6.not in 7.写kudu 1.timestamp类型 把日期字段转为timestamp类型,+日期函数,性能不是一般的赞,注意:kudu中timestamp和impala中的timestamp存储格式不一致,不要将timestamp类型字段作为主键,之前在cdh5.16上,以timestamp作主键,impal...原创 2020-08-11 16:35:44 · 2766 阅读 · 0 评论 -
调优impala:5个顶级的性能优化对于最牛b的mpp
不生产博客,只是汉化别人的成果 pdf链接 https://cdn.oreillystatic.com/en/assets/1/event/193/Tuning%20Impala_%20The%20top%20five%20performance%20optimizations%20for%20the%20best%20BI%20and%20SQL%20analytics%20on%20Ha...原创 2020-01-03 17:28:01 · 1965 阅读 · 0 评论 -
impala paper笔记
不生产博客,只是汉化别人的成果 目录 摘要 介绍 用户角度的impala 物理schema设计 sql 支持 架构 state distribution catalog service FRONTEND BACKEND runtime code generation I/O管理 Storage Formats 评估 ROADMAP impala paper...原创 2020-01-03 14:29:49 · 702 阅读 · 0 评论 -
《impala官网笔记》1.1 impala组件
不生产博客,只是官网的搬运工 目录 impala daemon impald statestore catalog service impala是一个分布式的mpp数据库引擎,在cdh集群中由运行在指定主机上的不同的daemon进程组成 impala daemon 核心的impala组件是impala daemon,由impalad(cdh impala服务impalad角...原创 2019-12-24 11:32:08 · 490 阅读 · 0 评论