HIVE中LIKE和RLIKE的区别

看书的过程中发现hive有两个用于通配的操作符,LIKE和RLIKE,查了些资料总结一点二者的区别

LIKE

语法格式为A [NOT] LIKE B,B是sql下的简单正则表达式,也叫通配符模式,如_匹配一个字符,%可以匹配任意多个字符,A会对表达式B做匹配,如果通过返回TRUE,如果不通过则返回FALSE,举个栗子
SELECT name LIKE ‘%Alice’ FROM table1,表示选择name列内以ALICE作为结尾的数据


RLIKE

语法格式为A [NOT] RLIKE B,基于java的正则表达式接口实现,如果A中有与B匹配则返回TRUE,否则返回FALSE,java的正则表达式相信大家都比较熟悉就不举具体的例子了


区别

通配符匹配的是整个列,比如helloworld就无法和’world’通配,但是正则表达式则是在列值内进行匹配,helloworld就可以和’world’匹配返回TRUE

另外,引入RLIKE该操作符的目的是引入正则表达式这样一个更加强大的语言来匹配条件,举个简单的对比例子

A RLIKE '.*(Alice|Ben).*'
匹配包含Alice或者Ben的字段,使用LIKE的话需要用两个LIKE来做组合,下面是使用LIKE改成相同效果
A LIKE '%Alice%' OR A LIKE '%Ben%'

### HiveSQL 中 RLIKE LIKE区别HiveSQL 中,`RLIKE` `LIKE` 是两种用于模式匹配的运算符。它们的主要功能都是用来判断字符串是否符合某种特定的模式,但在具体实现上存在显著差异。 #### 1. **LIKE 运算符** `LIKE` 主要用于简单的模式匹配操作,支持固定的通配符来定义匹配规则[^4]: - `_` 表示单个任意字符。 - `%` 表示零个或多个任意字符。 - `[charlist]` 表示字符列表中的任何一个单一字符。 - `[!charlist]` 或 `[^charlist]` 表示不在指定字符列表中的任何单一字符。 ##### 示例 假设有一张表 `employees`,其中包含字段 `name`,我们可以通过以下方式使用 `LIKE`: ```sql SELECT name FROM employees WHERE name LIKE 'J%'; -- 查询名字以 J 开头的所有员工 ``` ```sql SELECT name FROM employees WHERE name LIKE '_n%'; -- 查询第二个字母为 n 的所有员工名称 ``` --- #### 2. **RLIKE 运算符** `RLIKE` 支持更复杂的正则表达式来进行模式匹配。它允许用户通过标准的正则表达式语法定义更加灵活的匹配条件。这使得 `RLIKE` 成为了处理复杂字符串需求的强大工具。 ##### 正则表达式的常见元字符包括但不限于: - `.` 匹配任意单个字符。 - `*` 匹配前面的子表达式零次或多次。 - `+` 匹配前面的子表达式一次或多次。 - `{m,n}` 匹配前一项至少 m 次但不超过 n 次。 - `[]` 定义一个字符集合。 - `()` 定义分组。 - `|` 表示逻辑 OR。 ##### 示例 同样基于上述 `employees` 表格,我们可以这样使用 `RLIKE`: ```sql SELECT name FROM employees WHERE name RLIKE '^Jo.*'; -- 查询名字以 Jo 开头的所有员工 ``` ```sql SELECT name FROM employees WHERE name RLIKE '[0-9]'; -- 查询名字中含有数字的所有员工 ``` --- #### 3. **主要区别总结** | 特性 | `LIKE` | `RLIKE` | |---------------------|------------------------------------------|----------------------------------------| | **适用场景** | 简单的固定模式匹配 | 复杂的动态模式匹配 | | **支持的语法** | 固定通配符 (`_`, `%`) | 标准正则表达式 | | **灵活性** | 较低 | 高 | | **性能影响** | 性能较好 | 可能因正则表达式的复杂度而降低 | --- ### 结论 如果仅需执行简单模式匹配,则推荐使用 `LIKE`;而对于涉及更多高级匹配需求的情况(如查找含有特殊字符、满足某些规律的字符串),应优先考虑 `RLIKE`。 ```sql -- 使用 LIKE 查找以 A 开头的名字 SELECT * FROM table_name WHERE column_name LIKE 'A%'; -- 使用 RLIKE 查找含数字的名字 SELECT * FROM table_name WHERE column_name RLIKE '[0-9]'; ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值