hive substring_index()用法

前几天遇到这么一个需求,有一个字符串,表示用户在网站的访问路径,例如“home>itemdetail>cart>order”格式,当用户访问路径不足8步的时候,返回这个字符串,当访问路径大于8步的时候返回前8步路径。
实现的时候,我首先就想到了substring()函数,但转念一想,我需要截取第8个“>”字符前面的数据,那么我必须要知道这个>在字符串中的位置,中间考虑过几个函数都搞不定,比如instr()只能知道第一个“>”的位置;find_in_set()也不行,跟这个不搭边;regexp_extract()因为正则表达式没写明白放弃了。根据需求百度了一下,还是没找到,找了pdf版HiveSql开发指南,居然也没有符合条件的函数,不过冥冥之中,我感觉到,一定有一个hive内置字符串函数,可以搞定这个问题,于是去翻hive官方文档,地址:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF
在这里插入图片描述
没错!就是这个substring_index()函数,正好符合这个需求。下面是试验sql结果截图:
在这里插入图片描述
后记:写这篇博客主要因为百度的时候没找到substring_index()这个函数,在技术文档中也是没找到,所以在这里记录一下,希望有所帮助。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值