doris日期维度表

memory_copy

已于 2023-05-19 11:15:54 修改

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

文章标签： big data

于 2023-03-22 16:20:38 首次发布

本文链接：https://blog.youkuaiyun.com/memory_copy/article/details/129712632

insert into dim.dim_date

select row_number() over ( order by dim.date_value) id,

date_format(dim.date_value,'%Y-%m-%d') date_key,

date_format(dim.date_value,'%Y%m%d') date_value,

day(dim.date_value) day_of_month,

month(dim.date_value) month_value,

date_format(dim.date_value,'%Y%m') year_month,

date_trunc(dim.date_value,'month') month_first,

last_day(dim.date_value) month_end,

weekday(dim.date_value) + 1 day_of_week,

case

when weekday(dim.date_value) = 0 then '星期一'

when weekday(dim.date_value) = 1 then '星期二'

when weekday(dim.date_value) = 2 then '星期三'

when weekday(dim.date_value) = 3 then '星期四'

when weekday(dim.date_value) = 4 then '星期五'

when weekday(dim.date_value) = 5 then '星期六'

when weekday(dim.date_value) = 6 then '星期日'

end week_cn,

case

when weekday(dim.date_value) = 0 then 'Mon'

when weekday(dim.date_value) = 1 then 'Tues'

when weekday(dim.date_value) = 2 then 'Wed'

when weekday(dim.date_value) = 3 then 'Thur'

when weekday(dim.date_value) = 4 then 'Fri'

when weekday(dim.date_value) = 5 then 'Sat'

when weekday(dim.date_value) = 6 then 'Sun'

end week_en,

substr(yearweek(dim.date_value,1),-2) week_num,

yearweek(dim.date_value,1) year_week,

quarter(dim.date_value) season,

year(dim.date_value)*10 + quarter(dim.date_value) season_of_year,

if(month(dim.date_value)>6,2,1) half_year,

date_trunc(dim.date_value,'year') year_first,

days_sub(date_trunc(years_sub(dim.date_value,-1),'year'),1) year_end,

year(dim.date_value) year_num

from (select adddate('1900-01-01', number) date_value from numbers("number" = '73048')) dim -- 73048

-- select datediff('1900-01-01'，'2100-01-01')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

memory_copy

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

大数据Doris（五十四）：SQL函数之日期函数（二）

Lansonli（蓝深李）的博客

01-11

1503

默认为 yyyy-MM-dd HH:mm:ss ,也支持date_format中的format格式。将 unix 时间戳转化为对应的 time 格式，返回的格式由 string_format 指定。参数为Date或者Datetime类型或者可以cast为Date或者Datetime类型的数字。DAYOFWEEK函数返回日期的工作日索引值，即星期日为1，星期一为2，星期六为7。获得日期中的小时的信息，返回值范围从0-23。获得日期中的分钟的信息，返回值范围从0-59。参数为Date或者Datetime类型。

【大数据】Doris 数据库与表操作语法实战详解

最新发布

qq_25954159的博客

05-28

396

event_time` datetime NOT NULL COMMENT '事件发生的时间',`platform` varchar(30) NOT NULL COMMENT '平台标识符',`actual_bet_amount` decimal(10,2) NULL COMMENT '金额'基于ods_money做测试,数据量是3662649295；约36.6亿条数据；COMMENT '记录'

Doris的日期时间函数使用教程

yqj234的专栏

04-02

7723

返回datetime_expr2−datetime_expr1，其中datetime_expr1和datetime_expr2是日期或日期时间表达式。对于在 1970-01-01 00:00:00 之前或 2038-01-19 03:14:07 之后的时间，该函数将返回 0。将日期类型按照format的类型转化为字符串，当前支持最大128字节的字符串，如果返回值长度超过128，则返回NULL。DAYOFWEEK函数返回日期的工作日索引值，即星期日为1，星期一为2，星期六为7。

DORIS数据格式

09-04

描述DORIS数据格式https://passport.youkuaiyun.com/account/login?username=stonespark&activeCode=a4f6c6944b0703709050f5823a827923&service=http%3A%2F%2Fdownload.youkuaiyun.com%2Fdownload%2Fgaopu126%2F1494862

Doris 建表指定分区日期范围

SunTecTec

01-26

1233

【代码】Doris 建表创建指定分区。

维度表-事实表概念

m0_46325101的博客

09-23

1461

1个典型的例子是，把逻辑业务比作1个立方体，产品维、时间维、地点维分别作为不同的坐标轴，而坐标轴的交点就是1个具体的事实。也就是说事实表是多个维度表的1个交点。星状模型。首先介绍下数据库结构中的【星型结构】，该结构在位于结构中心的单个事实数据表中保护数据，其它维度数据存储在维度表中。每一个维度表与事实数据表直接相干，且通常通过1个键联接到事实数据表中。星型架构是数据仓库比较流向的1种架构。事实表是数据仓库结构中的中央表，它包括联系事实与维度表的数字度量值和键。事实数据表包括描写业务（例如产品销售）内

springboot整合doris(doris创建表)

qq_19891197的博客

08-13

2173

Column 可以分为两大类：Key 和 Value。Doris 的 Key 列是建表语句中指定的列，建表语句中的关键字 unique key 或 aggregate key 或 duplicate key 后面的列就是 Key 列，除了 Key 列剩下的就是 Value 列。新增可以使用key和value任意匹配，新增的会根据聚合类型进行操作，添加成功返回Affected rows: 1。新增可以使用key和value任意匹配，新增的如果存在就进行替换，添加成功返回Affected rows: 1。

Doris 全新分区策略 Auto Partition

08-07

1万+

自动分区在功能上基本覆盖了动态分区的使用场景，并带来分区规则前置的拓展，大大减轻了DBA 在管理数据时的工作负担。完成分区规则的定义后，大量的分区创建工作将全部由 Doris 自动完成。LIST 自动分区支持多列分区，每个自动创建的分区仅包含一个分区值，分区名长度不能超过 50。Auto List Partition 中，分区名的创建依赖某种特定的规则，对元数据维护具有特定的含义，长度 50 的分区名，所能包含的数据实际长度可能更短。RANGE 自动分区支持单个分区列，分区列类型必须为。

Doris的3种数据模型详解和数据仓库每一层的模型选用

大模型大数据攻城狮的专栏

03-22

943

Apache Doris是一个用于离线数据仓库开发的分布式SQL查询和分析引擎。在使用Doris进行离线数据仓库开发时，可以采用三种不同的数据模型：Duplicate模型、Aggregate模型和Unique模型。每种模型都有其适用的场景和特点，同时也对于不同层次的数据仓库有着不同的使用建议。

Doris--基础--13.2--SQl函数--日期函数

zhou920786312的博客

03-10

1万+

转换datetime值dt，从 from_tz 转到 to_tz 时区，并返回的结果值。如果参数无效该函数返回NULL。

大数据Doris（五十三）：SQL函数之日期函数（一）

Lansonli（蓝深李）的博客

01-10

1984

转换datetime值dt，从 from_tz 由给定转到 to_tz 时区给出的时区，并返回的结果值。将日期类型按照format的类型转化为字符串，当前支持最大128字节的字符串，如果返回值长度超过128，则返回NULL。%V | 周 (01-53) 星期日是一周的第一天，与 %X 使用。%v | 周 (01-53) 星期一是一周的第一天，与 %x 使用。%X | 年，其中的星期日是周的第一天，4 位，与 %V 使用。%x | 年，其中的星期一是周的第一天，4 位，与 %v 使用。

Doris/Mysql 常用的用户名加密、排序方式、日期

SunTecTec

12-04

372

select CONCAT(SUBSTRING('李晨', 1, 1), REPEAT('*', LENGTH('李晨')/3 - 1)) AS 用户名;select CONCAT(SUBSTRING('李晨', 1, 1), REPEAT('*', 2)) AS 用户名;order by field(物料类型,'病例','视频','科普','文章');select LENGTH('李晨'),LENGTH('李收到啦附件'),LENGTH('李收到'),-- 中文首字母拼音排序。

在QBI工具-Doris中，获取某天的上周一到上周日的数据

ru2234567的博客

12-07

741

QBI工具-Doris中，获取某天的上周一到上周日的数据。如：今天是2023-12-07，我想获取2023-11-27到2023-12-02的数据

Apache Doris 基础 -- 数据表设计（分区分桶）

chinusyan的专栏

05-31

3324

Apache Doris 基础 -- 数据表设计（分区分桶）

Apache Doris使用部分日期函数导致分区裁剪失效总结

weixin_43914798的博客

06-27

1941

Doris内置了很多日期函数，但在分区字段上使用部分日期函数会导致分区裁剪异常，导致谓词无法下推，全量扫描数据。

Doris常用函数

2201_75550155的博客

02-15

4780

- 2023-07-10 06:19:54 返回当前(国际标准时间)UTC日期和时间在 "YYYY-MM-DD HH:MM:SS" 或 "YYYYMMDDHHMMSS"格式的一个值。

Apache Doris 详细教程（二）

白鸽

12-03

3333

doris详细教程二

doris分区

03-27

### Apache Doris 分区使用指南 #### 什么是分区？在 Apache Doris 中，分区是一种用于管理和优化大规模数据的技术。它允许用户按照某些列的值将表中的数据划分为多个逻辑部分，从而提高查询性能并简化数据管理[^1]。 #### 分区的作用分区的主要作用在于提升查询效率和降低资源消耗。通过合理的分区设计，可以减少扫描的数据量，加速过滤操作，并支持更高效的分布式计算[^2]。 #### 常见的分区类型 Apache Doris 支持多种类型的分区方式，以下是几种常见的分区策略： - **Range 分区** Range 分区基于某一列的范围来划分数据。例如，可以根据时间戳字段创建按天、周或月的分区。这种方式非常适合处理具有明显时间特征的数据集[^3]。 - **Hash 分区** Hash 分区通过对指定列的值进行哈希运算并将结果映射到固定的分区上。这种分区方法能够均匀分布数据，适用于需要随机访问不同数据子集的场景。 - **List 分区** List 分区适合于离散值集合的情况。比如，如果某列只有有限几个可能取值，则可以通过显式列举这些值来进行分区定义。 #### 如何配置分区？下面是一个简单的例子展示如何在一个新表中设置 `Range` 类型的时间维度上的分区： ```sql CREATE TABLE example_table ( id BIGINT, date DATE, value DOUBLE ) PARTITION BY RANGE(date) ( PARTITION p202301 VALUES LESS THAN ('2023-02-01'), PARTITION p202302 VALUES LESS THAN ('2023-03-01') ); ``` 上述 SQL 创建了一个名为 `example_table` 的表格，并将其依据日期字段进行了两个阶段式的 range 划分。对于 hash 分区而言，通常会结合 bucketing 来进一步细化控制每一分区内数据的具体布局情况如下所示: ```sql CREATE TABLE another_example ( key STRING, val INT ) DISTRIBUTED BY HASH(key) BUCKETS 8; ``` 此命令表示该表将会被分配至八个独立 buckets 当中去执行后续的操作流程。 ---