
SQL
文章平均质量分 61
得得得个桔
这个作者很懒,什么都没留下…
展开
-
互相关注(共同好友)怎么计算? (2)
第二种方法使用了子查询并且利用了标记,大数据的情况下查询效率更加好。第一种方法更加简便理解成本更低。原创 2024-07-25 15:50:44 · 285 阅读 · 0 评论 -
留存率怎么计算?
首先,先要明白留存率是什么,百度的解释是:其具体含义为在统计周期(周/月)内,每日活跃用户数在第N日仍启动该App的用户数占比的平均值,其实简单点来说,拿次留率来举例子的话就是今天这批在线的用户数量作为分母,明天这批用户仍在线的用户数量作为分子。从留存率的定义入手,我们可以知道这个指标的计算肯定是涉及到今天与其他天(比如明天)的数据之间的关系的,是否就意味着对表进行自连接之后,可以得到相应的数据帮助我们计算留存率指标呢?留存率的计算是数据开发工作中常见中常见的字段需求,同时也是面试sql题考察的重中之重。原创 2024-07-23 16:17:50 · 454 阅读 · 0 评论 -
Hive中位数到底是怎么求的?
常规不用hive的解决方法是:首先添加两列字段,这两列分别是score所在的位置、总数据个数。这里的逻辑筛选后,可以得到得到一行数据和两行数据(分别对应奇数和偶数,如果是偶数的话,你这样+2然后除2得到是个带小数点的数值,筛选就找不到她了),然后用对筛选出来的数据进行一个avg( )就可以了。这一个函数则是得到近似分布的值,相对没那么精确,但是他比较适合大规模数据集,数据仓库ETL中可能用它更加合适。实习过程中,接到一个需求,里面有个要计算中位数的字段,之前没见过,遂记录。一切的一切数据先排序。原创 2024-07-18 18:57:57 · 330 阅读 · 0 评论 -
SQL做题笔记(LeetCode176)
。原创 2023-03-01 23:02:00 · 56 阅读 · 0 评论 -
SQL做题笔记(LeetCode175)
日后总计与温记原创 2023-03-01 09:28:55 · 62 阅读 · 3 评论