hive-sql截取汉字、字母和数字等

本文介绍了如何使用正则表达式在SQL查询中截取数字、字母、汉字以及组合字符。通过`regexp_extract`和`regexp_replace`函数,可以高效地从字符串中提取或替换特定类型的字符,例如数字、字母和汉字,这对于数据清洗和信息提取至关重要。
部署运行你感兴趣的模型镜像

在查询字段中截取汉字、字母和数字等代码如下:


1、截取数字

select regexp_extract('$%^&&*!(123hello你好,。.,','([0-9]+)',1);
--输出:123
select regexp_replace('$%^&&*!(123hello你好,。.,','[^0-9]','');
--输出:123

 2、截取字母

select regexp_extract('$%^&&*!(123hello你好,。.,','([a-zA-Z]+)',1);
---输出:hello
select regexp_extract('$%^&&*!(123hello你好,。.,','[^a-zA-Z]','');
---输出:hello

  3、截取汉字

select regexp_extract('$%^&&*!(123hello你好,。.,','([\\\u4e00-\\\u9fa5]+)',1);
---输出:你好
select  regexp_replace('$%^&&*!(123hello你好,。.,','[^\\\u4e00-\\\u9fa5]','');
---输出:你好

   4、截取字母、数字或汉字

select regexp_extract('$%^&&*!(123hello你好,。.,','([0-9a-zA-Z\\\u4e00-\\\u9fa5]+)',1);
---输出:123hello你好
select regexp_replace('$%^&&*!(123hello你好,。.,','[^0-9a-zA-Z\\\u4e00-\\\u9fa5]','');
---输出:123hello你好

您可能感兴趣的与本文相关的镜像

ACE-Step

ACE-Step

音乐合成
ACE-Step

ACE-Step是由中国团队阶跃星辰(StepFun)与ACE Studio联手打造的开源音乐生成模型。 它拥有3.5B参数量,支持快速高质量生成、强可控性和易于拓展的特点。 最厉害的是,它可以生成多种语言的歌曲,包括但不限于中文、英文、日文等19种语言

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值