select url,regexp_extract(k.url,'(.*?)(/$|[^/]$)',1)url_new from table_2022 k
错误写法:
select url,regexp_extract(k.url,'((.*?)/$)|((.*?)[^/]$)',1)url_new from table_2022 k
注意:
hive regexp_extract(string subject,string pattern,int index)方法中,index 是以小括号为标准的,如果是上面错误示范中的写法,返回的永远是|前面的第一个小括号中的匹配内容。切记!
本文讲解如何正确使用`regexp_extract`函数从URL中提取路径,避免了常见错误,并强调了在Hive中使用小括号索引的重要性。主要关注信息技术领域中的正则表达式应用。
4057

被折叠的 条评论
为什么被折叠?



