select url,regexp_extract(k.url,'(.*?)(/$|[^/]$)',1)url_new from table_2022 k
错误写法:
select url,regexp_extract(k.url,'((.*?)/$)|((.*?)[^/]$)',1)url_new from table_2022 k
注意:
hive regexp_extract(string subject,string pattern,int index)方法中,index 是以小括号为标准的,如果是上面错误示范中的写法,返回的永远是|前面的第一个小括号中的匹配内容。切记!