在使用hive中函数regexp_extract需要注意的是正则表达式的\需要使用\进行转义,也就是说,需要使用\\两道斜线。
使用案例:
select regexp_extract('4.2.3.','\\d',0) from error_20111101 limit 4;
提取版本信息:
select regexp_extract('4.2.3.','[\\d+\\.]+',0) from error_20111101 limit 4;
select regexp_extract('a4.2.3.','[\\d+\\.]+',0) from error_20111101 limit 4;
本文介绍了在Hive中如何正确使用regexp_extract函数提取字符串中的特定模式。特别注意正则表达式中的转义字符需要使用\进行转义。通过两个实际例子展示了如何提取纯数字及版本号。
4089

被折叠的 条评论
为什么被折叠?



