
GreenPlum
CristianT
这个作者很懒,什么都没留下…
展开
-
GreenPlumn数据库体系结构
GreenPlumn 数据库是基于 PostgreSQL 基础上开发,具有巨大的并行处理能力的数据仓库,MPP( massively parallel processing )是 GreenPlumn的主要特性, MPP是指服务器上拥有两个或者以上的处理节点,并且多个处理节点可以并行,协同的工作来完成一个计算, 这些处理节点拥有独自的内存,操作系统和硬盘, 处理节点可以理解成为一台物理主机。Gre转载 2016-01-17 10:27:29 · 1893 阅读 · 0 评论 -
GREENPLUM优化建议
1. 在完成大批量数据装载之后,针对目标表总是进行vacuum analyze操作。2. 表的布局:尽量把数据分布键放在最前面,如果是分区表,那么接下来是分区键,并且在此基础上建议按照数据类型宽度从大到小的顺序排列比如先8 byte的列,再4字节,再2字节。3. 数据分布键的选择:数据分布均匀是保证GP高效并行处理能力的基础。因此定义表时,如果选用HASH分布策略,保证数据分布均匀转载 2016-01-18 21:13:31 · 3669 阅读 · 0 评论 -
GreenPlum 介绍 - client认证、限制并发、SSL连接
【设置client认证】要从远端连接GP,修改配置文件 pg_hba.conf (标准PostgreSQL host-basedauthentication文件)虽然在master和segment都存在pg_hba.conf,但是只要修改master就可以了。client只能连接master,从来不需要直连segment。pg_hba.conf的内容远端访问格式如下:local转载 2016-01-18 22:00:36 · 1178 阅读 · 0 评论 -
表关联优化方法分享
在数据库中,表与表之间的关联,通过JOIN连接。可以理解为“横向关联”,如果是多个大表,“横向关联”,效率比较慢; “纵向关联”:UNION每个表,再GROUPBY去重,得到“关联”的效果。“纵向关联”效率比“横向关联”强很多。举例:T1,T2,T3,T4,T5,每个表有5000万条数据。“横向关联”: JOIN关联,实际是5000万*5000万*5000万*5000万*5000万,实原创 2016-06-11 23:01:26 · 1284 阅读 · 0 评论 -
Greenplum中内存设置不合理导致的报错
现象:以下2个案例:1.RPSM_TRADE_INFO_NLC这个脚本的 560行报错脚本中写法: DELETEFROM $RPSM_SCH.RPSM_TRADE_INFO O USING TEMP_RPSM_TRADE_INFO_NLC_YXLC_PRE N WHEREN.TRANS_SID = O.TRA原创 2016-10-20 23:25:30 · 9656 阅读 · 0 评论 -
获取gp表结构的函数
说明:此函数可以获取二级分区表以内的表结构,里面添加了一些关键字过滤,可能不全,遇到时可自行添加用法:select get_gp_create_sql('schemaname.tablename')-- Function: public.get_gp_create_sql(text)-- DROP FUNCTION public.get_gp_create_sql(te原创 2016-10-20 23:26:13 · 3807 阅读 · 0 评论 -
JOIN详解
JOIN详解SQL中JOIN有多种:JOIN、INNER JOIN、FULL JOIN、FULL OUTER JOIN、LEFT JOIN、LEFT OUTER JOIN、RIGHT JOIN、LEFT OUTER JOIN。同时不还要注意ON ,WHERE等条件使用。注:1、只有 FULL JOIN 完全强制连接顺序2、大多数 LEFT JOIN 或 RI原创 2016-10-20 23:47:22 · 997 阅读 · 0 评论