大数据
文章平均质量分 52
魂斗罗不打架
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
正则表达式() [] {}区别
圆括号()是组,主要应用在限制多选结构的范围/分组/捕获文本/环视/特殊模式处理方括号是单个匹配 字符集/排除字符集/命名字符集转载 2020-10-20 15:15:00 · 2752 阅读 · 4 评论 -
hive若干正则
1.REGEXP_EXTRACT命令格式STRING REGEXP_EXTRACT(STRING source, STRING pattern[, BIGINT occurrence])命令说明将字符串source按照pattern正则表达式的规则拆分,返回第occurrence个group的字符。参数说明source:STRING类型,待搜索的字符串。pattern:STRING类型常量,如果pattern为空串或者pattern中没有指定group,则返回异常。occurrence:BI原创 2020-10-16 19:42:23 · 393 阅读 · 0 评论 -
列式存储
1 为什么要按列存储列式存储(Columnar or column-based)是相对于传统关系型数据库的行式存储(Row-basedstorage)来说的。简单来说两者的区别就是如何组织表(翻译不好,直接抄原文了):Ø Row-based storage stores atable in a sequence of rows.Ø Column-based storage s...转载 2019-07-16 21:08:35 · 408 阅读 · 0 评论 -
MYSQL语法大全
用户管理新建用户及密码:foo为名,123为密码,locahost为固定地址登录# 以下为两种创建方式CREATE USER foo@localhost IDENTIFIED BY ‘123’ insert into mysql.user(Host,User,Password) values("localhost","test",password("1234"));#只要更改了用户..转载 2019-01-29 18:46:44 · 5411 阅读 · 2 评论 -
SQL删除方法
目录一、Truncate语法二、Truncate使用注意事项三、不能对以下表使用 TRUNCATE TABLE四、TRUNCATE、Drop、Delete区别当你不再需要该表时, 用 drop;当你仍要保留该表,但要删除所有记录时, 用 truncate;当你要删除部分记录时(always with a WHERE clause), 用 delete.Truncate是一个...转载 2018-11-21 23:09:56 · 2956 阅读 · 0 评论 -
MySQL随笔记
目录1.备份2.重命名3.截取4.查询重复的数据1.备份create table dim_vcs_tmp as select * from dim_vcs; //将表dim_vcs表结构和数据复制到dim_vcs_tmp,自动创建表dim_vcs_tmp。 create table dim_vcs_tmp like dim_vcs; //先将表结构以及索引复制过来。...原创 2018-11-21 22:09:24 · 181 阅读 · 0 评论 -
Mysql字符串截取总结:left()、right()、substring()、substring_index()
在实际的项目开发中有时会有对数据库某字段截取部分的需求,这种场景有时直接通过数据库操作来实现比通过代码实现要更方便快捷些,mysql有很多字符串函数可以用来处理这些需求,如Mysql字符串截取总结:left()、right()、substring()、substring_index()。一.从左开始截取字符串用法:left(str, length),即:left(被截取字符串, 截取长度)S...原创 2018-11-27 14:30:17 · 312 阅读 · 0 评论 -
MySQL REPLACE字符串函数简介
一、MySQL为您提供了一个有用的字符串函数REPLACE(),它允许您用新的字符串替换表的列中的字符串。REPLACE()函数的语法如下:REPLACE(object, search,replace);REPLACE()函数有三个参数,它将object中的search替换为replace字符串。注意: 有一个也叫作REPLACE的语句用于插入或更新数据。所以不要将REPLACE语句与...转载 2018-11-27 22:42:36 · 1717 阅读 · 1 评论 -
dataworks/odps上传资源,注册函数,下载资源
‘list resource; /查资源列表list functions; /查函数’可以在dataworks或odpscmd里原创 2018-12-17 16:15:25 · 3230 阅读 · 1 评论 -
浅析Hive的group by和count(distinct)
首先,Hive的group by和count(distinct)都是去除重复的数据,某种程度上来说,两者产生的结果是一样的。 实例代码:select a,count(distinct b) from t group by aselect tt.a,coun...转载 2019-07-05 15:42:57 · 4295 阅读 · 0 评论 -
浅析Hive的group by和count(distinct)
<div id="article_content" class="article_content clearfix" data-track-click="{"mod":"popu_307","con":",https://blog.youkuaiyun.com/dm_sourc...转载 2019-07-05 15:36:29 · 950 阅读 · 0 评论 -
Blink中时间函数(FROM_UNIXTIME/UNIX_TIMESTAMP/TO_TIMESTAMP等)
1.背景blink处理后一般输出到DWD层DataHub,再同步到ODPS中。某个项目的cjsj提取出来是14为的varchar类型,如20190531115119,需要转换层timestamp和bigint类型。但是前人转出的是错误的,timestamp变成了20位。2.函数说明1.FROM_UNIXTIME返回VARCHAR类型的日期值,输入参数是Bigint类型,输出可以按格式输出...原创 2019-05-31 18:01:33 · 4625 阅读 · 0 评论 -
MySQL列转行
使用case when达到列转行的效果,如下:1.为了统计摄像头一周产生的数量,将摄像头放在纵轴,将时间放在横轴。2.先按摄像头和时间分组统计数量合并起来,再在外层再按摄像头分组。使用MAX函数是为了只用摄像头分组,否则会出现一个摄像头有7行。3.为了更好看后面日期的情况,按倒序排序。SELECT sxtid ,MAX(CASE WHEN dt='20190101' TH...原创 2019-01-08 20:32:16 · 1303 阅读 · 0 评论 -
COUNT(1),COUNT(*),COUNT(col)的去别和统计同一列中不同种类的数量占总数的比例
一:让我们先看一下BOL里面对count(*)以及count(col)的说明:COUNT(*) 返回组中的项数。包括 NULL 值和重复项。COUNT(ALL expression) 对组中的每一行都计算 expression 并返回非空值的数量。expression: 除 text、image 或 ntext 以外任何类型的表达式。不允许使用聚合函数和子查询。:指定应该计算所有行以返...原创 2018-12-14 14:43:56 · 1283 阅读 · 0 评论 -
join on 和where的执行顺序
转自:https://www.cnblogs.com/Jessy/p/3525419.htmlleft join :左连接,返回左表中所有的记录以及右表中连接字段相等的记录。right join :右连接,返回右表中所有的记录以及左表中连接字段相等的记录。inner join: 内连接,又叫等值连接,只返回两个表中连接字段相等的行。full join:外连接,返回两个表中的行:lef...转载 2018-11-02 15:46:15 · 1884 阅读 · 0 评论 -
ODPS随笔记---内建函数TO_CHAR、TO_DATE、INSERT INTO
ODPS内建函数TO_CHAR、TO_DATE的简单使用1.TO_CHAR:将日期类型date按照format指定的格式转成字符串。SELECT TO_CHAR('2018-10-27 22:17:55','yyyymmddhhmiss') as stg_rksj FROM dwd_dz_gj_ryjghxx_di;返回201810272217552.TO_DATE:将一个format格式...原创 2018-10-31 16:22:40 · 9590 阅读 · 0 评论
分享