MySql - 函数、日期处理 [COUNT、SUM、MAX、NOW、UNIX_TIMESTAMP]

---------------------------------
---------------------------------

-- 函数操作

---------------------------------
---------------------------------

-- COUNT 计算指定字段出现的个数,不包含NULL值
-- SUM 计算某一列值的总和
-- AVG 计算某一列值的平均数
-- MAX 获取某一列值的最大数
-- MIN 获取某一列值的最小数
-- CONCAT 将多个字符串连接成一个字符串
-- CONCAT_WS 和concat()一样,但是可以指定分隔符(concat_ws就是concat with separator)
-- GROUP_CONCAT 将分组中括号里对应的字符串进行连接.如果分组中括号里的参数xxx有多行,那么就会将这多行的字符串连接,每个字符串之间会有特定的符号进行分隔。
-- LEFT 是一个字符串函数,它返回具有指定长度的字符串的左边部分。
-- RIGHT 是一个字符串函数,它返回具有指定长度的字符串的右边边部分。
-- SUBSTRING 截取字符串
-- SUBSTR 截取字符串
-- FROM_UNIXTIME 时间戳转字符串 FROM_UNIXTIME(timestamp/TimestampField, '%Y-%m-%d %H:%i:%s')
-- UNIX_TIMESTAMP() 获取当前时间戳 秒
-- DATE_FORMAT
-- CURRENT_DATE 获取当前日期 YYYY-MM-DD
-- CURRENT_TIME 获取当前时间 HH:II:SS



-- 统计总数COUNT
-- COUNT(expr) ,返回SELECT语句检索的行中expr的值不为NULL的数量。结果是一个BIGINT值。
-- COUNT(*) 的统计结果中,会包含值为NULL的行数。
-- COUNT(*) 是SQL92定义的标准统计行数的语法, Mysql对其进行了优化,跟数据库无关,跟NULL和非NULL无关
-- COUNT(FieldColumn) 查询FieldColumn不为空的总行数

-- MyIsam执行COUNT(*)可直接返回记录的总条数,不能带有WHERE的情况下。MyIsam已经把表的总行数放到磁盘文件中了。
-- InnoDB因为有行级锁和事务,总数容易出现变化,所以没有存储到磁盘文件中。[统计和并发写执行的时候写的统计要比查的统计多]
-- 【MySQL 8+】InnoDB执行COUNT(*)会优先按照成本较低的索引进行扫表统计。如果只有聚簇索引就只能按照聚簇索引统计,如果有普通索引,会按照成本较小的索引进行统计
    -- 在执行统计的sql中不能包含where和group by等
-- COUNT(常量[1,2,3...])与COUNT(*)效率等同,没有谁比谁好。COUNT(*)是sql标准语法,所以建议用count(*)
-- COUNT(FieldColumn) Mysql执行的时候会按照指定字段列进行统计,全表扫描,每行做判断不为NULL就累加,为NULL就跳过。所以比COUNT(*)慢
-- 没有WHERE、GROUP BY的时候 count(FieldColumn) < COUNT(*) COUNT(1)基本等于COUNT(*)
    -- 所以统计的时候建议直接使用COUNT(*)就行了。
-- 参考: https://blog.youkuaiyun.com/weixin_50966947/article/details/126769434
SELECT COUNT(*) FROM users;
SELECT COUNT(`id`) FROM users;
SELECT COUNT(1) FROM users;


-- 求总和SUM
-- SELECT SUM(FieldColumn) as sum FROM TABLENAME WHERE expr...;
-- 如果在没有返回匹配行 SELECT 语句中使用 SUM 函数,则 SUM 函数返回 NULL,而不是 0。
-- 忽略计算中的 NULL 值。

ALTER TABLE users ADD integral INT(11) DEFAULT 0 NULL COMMENT '用户积分';
SELECT SUM(integral) as total_integral FROM users;


-- 求平均数AVG
-- SELECT AVG(FieldColumn) FROM TABLENAME WHERE expr...;
-- 返回float
-- 忽略计算中的 NULL 值[值为NULL的行不参与计算]。

SELECT AVG(integral) as avg_num FROM users;


-- 获取单列的最大值 MAX
-- 获取单列的最小值 MIN
-- SELECT MAX(FieldColumn) FROM TABLENAME WHERE expr...;
-- SELECT MIN(FieldColumn) FROM TABLENAME WHERE expr...;
-- 忽略计算中的NULL行,值为NULL的行被忽略

SELECT MAX(integral) as max_num FROM users;
SELECT MIN(integral) as min_num FROM users;


-- 字符串拼接 CONCAT、CONCAT_WS
-- SELECT CONCAT(Field1, Field2...) AS newField FROM TABLENAME WHERE expr...;
-- SELECT CONCAT_WS(separator, Field1, Field2...') AS newField FROM TABLENAME WHERE expr...;
-- [CONCAT] NULL:要拼接的字段只要有一个字段的值为NULL 结果就为NULL
-- [CONCAT_WS] NULL:拼接的字符串类型的字段有NULL值,会被忽略掉,把剩下的非NULL值按照分隔符拼接

SELECT `id`,CONCAT(username, status) as us FROM users;
SELECT `id`,CONCAT_WS(',', username, status) as us FROM users;
SELECT `id`, CONCAT(username, `status`, `integral`) as ust FROM users;
SELECT `id`, CONCAT_WS(',', username, `status`, `integral`) as ust FROM users;


-- 分组拼接字符串GROUP_CONCAT
-- SELECT GROUP_CONCAT(field ORDER BY Field SEPARATOR sep) FROM TABLENAME WHERE expr... GROUP BY FieldColumn;
-- 如果没有写ORDER BY句段,那么连接是没有顺序的,基本按照查出来的数据顺序拼接。
SELECT `status`,GROUP_CONCAT(CONCAT_WS(',', username, integral) ORDER BY `integral` DESC SEPARATOR ';') as n FROM users GROUP BY `status`;
SELECT `status`,GROUP_CONCAT(CONCAT_WS(',', username, integral) SEPARATOR ';') as n FROM users GROUP BY `status`;


-- LEFT、RIGHT
-- SELECT LEFT(FieldColumn, length) AS field FROM TABLENAME;
-- SELECT field1,field2... FROM TABLENAME WHERE LEFT(FieldColumn, length) = VALUE ...;
-- SELECT RIGHT(FieldColumn, length) AS field FROM TABLENAME;
-- SELECT field1,field2... FROM TABLENAME WHERE RIGHT(FieldColumn, length) = VALUE ...;
-- 如果FieldColumn值为NULL则LEFT与RIGHT的返回值都是NULL
-- 如果length为小于等于0的值,返回结果为空字符串[NULL还是NULL]
-- 参考:https://blog.youkuaiyun.com/moakun/article/details/82086078

SELECT LEFT(username, 2) as username FROM users;
SELECT `id`, username FROM users WHERE LEFT(username, 2) = 'He' OR LEFT(username, 2) LIKE '%h';
SELECT RIGHT(username, 2) as username FROM users;
SELECT RIGHT(username, -1) as username FROM users;
SELECT `id`, username FROM users WHERE RIGHT(username, 2) = 'LO' OR RIGHT(username, 2) LIKE '%l%';


-- 截取字符串 SUBSTR、SUBSTRING
-- SUBSTR(Start, Length) Start开始位置 Length 长度
-- SUBSTRING(Start, Length) Start开始位置 Length 长度
-- 位置:第N个字符,不是第N个字符的下标[从1开始的,不是从0开始的]
-- NULL一直都是NULL
-- SELECT SUBSTR(FieldColumn, start, length) FROM TABLENAME;
-- SELECT * FROM TABLENAME WHERE SUBSTR(FieldColumn, start, length) = Value ...;
-- SELECT SUBSTRING(FieldColumn, start, length) FROM TABLENAME;
-- SELECT * FROM TABLENAME WHERE SUBSTRING(FieldColumn, start, length) = Value ...;

SELECT SUBSTR(username, 1, 3) FROM users;
SELECT SUBSTRING(username, 2, 3) FROM users;
SELECT * FROM users WHERE SUBSTR(username, 2, 3) = 'est';
SELECT * FROM users WHERE SUBSTRING(username, 2, 3) = 'est';


-- 日期时间处理
-- https://www.w3school.com.cn/sql/func_date_format.asp

SELECT UNIX_TIMESTAMP(); -- 1677141154
SELECT UNIX_TIMESTAMP('2023-02-23 16:32:34'); -- 1677141154
SELECT FROM_UNIXTIME(UNIX_TIMESTAMP(), '%Y-%m-%d %H:%i:%s'); -- 2023-02-23 16:32:34
SELECT CURRENT_DATE; -- 2023-02-23
SELECT CURRENT_TIME; -- 16:32:34
SELECT CURRENT_TIMESTAMP; -- 2023-02-23 16:32:34
SELECT CURRENT_TIMESTAMP(); -- 2023-02-23 16:32:34
SELECT NOW(); -- 2023-02-23 16:32:34
SELECT LOCALTIME; -- 2023-02-23 16:32:34
SELECT LOCALTIME(); -- 2023-02-23 16:32:34
SELECT LOCALTIMESTAMP; -- 2023-02-23 16:32:34
SELECT LOCALTIMESTAMP(); -- 2023-02-23 16:32:34
SELECT DATE_FORMAT(NOW(), '%Y-%m[%b]-%d %H:%i:%s.%f[%j:%M, %a]'); -- 2023-02[Feb]-23 16:40:30.000000[054:February, Thu]
SELECT DATE_FORMAT(UNIX_TIMESTAMP(), '%Y-%m[%b]-%d %H:%i:%s.%f[%j:%M, %a]'); -- NULL DATE_FORMAT参数为字符串,非时间戳
<think>嗯,用户问的是to_unix_timestampunix_timestamp之间的区别。我需要先弄清楚这两个函数在不同系统里的表现。根据提供的引用,比如引用[3]提到spark-sql中使用to_unix_timestamp将字符串转为时间戳,而引用[2]里说unix_timestamp可以不带参数返回当前时间戳,或者带日期参数转换。 可能要注意的是,不同数据库处理框架中的实现可能不同。比如在Hive或MySQL中,unix_timestamp可能作为函数名,而Spark SQL中可能用to_unix_timestamp来明确转换。需要区分它们的参数格式是否必须指定,以及返回值类型是否有差异。 引用[4]提到to_timestamp和from_unixtime的使用,涉及到类型转换,比如bigint转timestamp可能需要用FROM_UNIXTIME。这可能影响到用户在处理时间戳时是否需要调整格式。 另外,用户可能需要了解语法差异,比如unix_timestamp在Spark中是否需要指定格式,而to_unix_timestamp是否强制要求格式参数。例如,引用[3]中的例子显示to_unix_timestamp需要指定格式,而引用[2]中的unix_timestamp可能支持更多隐式格式。 还要考虑返回值的单位,是否是秒还是毫秒,比如引用[4]提到bigint类型为13位毫秒,需要除以1000,这可能涉及到函数处理时间戳时的精度问题。 总结下来,区别主要在于函数名在不同系统中的使用、参数要求(是否必须指定格式)、以及是否支持隐式转换。需要明确回答这两个函数的功能、参数差异和适用场景,帮助用户正确选择使用哪一个。</think>### 功能及区别分析 **`unix_timestamp`** 和 **`to_unix_timestamp`** 均为时间戳转换函数,但使用场景和语法细节存在差异: #### 1. **功能定义** - **`unix_timestamp`** - **无参数调用**:返回当前时间的Unix时间戳(以秒为单位),例如: $$ \text{SELECT UNIX_TIMESTAMP()} → 1717023000 \quad (\text{当前时间对应的秒数}) $$ [^2] - **带参数调用**:将指定格式的日期字符串转换为Unix时间戳,支持隐式格式解析,例如: $$ \text{SELECT UNIX_TIMESTAMP('2023-01-20 10:00:00')} → 1674180000 $$ [^2] - **`to_unix_timestamp`** - **必须带参数调用**:**强制要求指定日期字符串和格式**,将字符串按给定格式转换为Unix时间戳,例如: $$ \text{SELECT TO_UNIX_TIMESTAMP('20231021', 'yyyyMMdd')} → 1697846400 $$ [^3] #### 2. **核心区别** | 特性 | `unix_timestamp` | `to_unix_timestamp` | |--------------------|--------------------------|-----------------------------| | **参数要求** | 可无参数,可接受隐式日期格式 | 必须指定日期字符串和格式 | | **格式灵活性** | 支持多种隐式日期格式(如`yyyy-MM-dd`) | 需严格匹配指定格式(如`yyyyMMdd`) | | **典型应用场景** | 简单转换或获取当前时间戳 | 需要明确控制输入格式的场景 | #### 3. **实际案例对比** - **隐式转换 vs 显式转换** ```sql -- 隐式解析(unix_timestamp) SELECT UNIX_TIMESTAMP('2023-01-20'); -- 自动解析为日期 -- 显式解析(to_unix_timestamp) SELECT TO_UNIX_TIMESTAMP('20230120', 'yyyyMMdd'); -- 必须指定格式 ``` 若日期格式不标准(如`20230120`),`unix_timestamp`可能解析失败,而`to_unix_timestamp`通过指定格式可确保转换成功[^3][^4]。 - **与`from_unixtime`联动** ```sql -- 时间戳转字符串 SELECT FROM_UNIXTIME(1674180000, 'yyyy-MM-dd HH:mm:ss') → '2023-01-20 10:00:00' [^3] ``` #### 4. **注意事项** - **类型兼容性**:若原始时间为`BIGINT`类型(如13位毫秒时间戳),需先转换为秒: $$ \text{TO_TIMESTAMP}(ts/1000) \quad \text{或} \quad \text{FROM_UNIXTIME}(ts/1000) $$ [^4] - **时区影响**:两者默认使用系统时区,跨时区场景需显式指定。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值