目录
模型命名规范
SQL文件约定
SQL编码规范
文件头部
SQL结构
编码习惯
HIVE学习资源汇聚
模型命名规范
整体命名格式
[库名/层名]_[主题/DBNAME]_[具体表名]_[模型更新周期][全量/增量标识]
(1)[库名/层名]:
stg: 贴源数据 表名采用 stg_dbname_tablename_[模型更新周期][全量/增量标识]
ods: 仓库基础层 为线上库快照数据
dw: 仓库基础层 部分模型为缓慢变化表
olap/fact: 实事表,方便rpt统计或者kylin计算的准备数据
rpt: 重度汇总数据,指标统计数据,指标配置明细数据
dim: 维度表、字典表
tmp: 临时表
(2)[主题]:
与具体业务相关暂不提供
(3)[具体表名]
尽量保持与业务系统原表名保持一致,方便溯源
(4)[模型更新周期]
y:年
m:月
d:日
h:小时
rt:实时准实时
(5)[全量/增量标识]
a:全量
i:增量
SQL文件约定
(1) 一个SQL文件尽量只生成成一个目标表(可以有多个分区),特殊情况除外
(2) 文件名与SQL文件中目标表名保持一致,方便查找。若存在多个目标表,则选最重要的一个表名作为文件名,都重要可以随机选择一个
(3) SQL文件格式与编码保持与其执行环境保持一致,避免乱码。目前 SQL文件格式统一为 UNIX(LF),文件编码统一为 UTF-8
(4) SQL文件无论是标准数据库SQL还是非标准HiveQL、SparkSQL,文件扩展名统一采用”.sql”,方便编辑器识别文件,并提供着色功能
(5) SQL文件中不能出现TAB字符,否则会报错,SQL正文中的TAB可以使用\t替换
(6) SQL文件除正常SQL语句结尾可以有”;” ,备注中不能出现”;”,否则会报异常
(7) SQL正文中若出现关键字为字段的情况使用反引号进行转义,以防出现异常
(8) SQL正文中尽量统一使用小写字母,不建议关键字使用大写,避免编码时大小写切换的麻烦
SQL编码规范
文件头部
提供标准文件附加信息,便于后期维护,如:
– =========================================================================
– **创建人: chinamobile chinamobile@lianjia.com 13800013800
– **创建时间: YYYY-MM-DD
– **代码描述:XXXXX日分析
– **涉及需求:
– ** 提供需求提出人信

本文档详述了HQL在数据仓库中的编码规范,包括模型命名、SQL文件约定、编码习惯等方面,强调了文件命名一致性、SQL结构、参数设置、DML语句的编写规则,以及如何进行HIVE查询优化,旨在提高代码可读性和维护性。
最低0.47元/天 解锁文章
1513

被折叠的 条评论
为什么被折叠?



