数据去重

最新推荐文章于 2025-03-26 17:04:30 发布

@nanami

最新推荐文章于 2025-03-26 17:04:30 发布

阅读量236

点赞数 1

CC 4.0 BY-SA版权

分类专栏：工具使用文章标签： notpad++ excel

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/i_mycode/article/details/102724119

工具使用专栏收录该内容

2 篇文章

订阅专栏

多工具数据行去重

探讨可加扣扣群:866808402

1.notepad++
有数据如下:
在这里插入图片描述
现要去除重复行数据,ctrl+h替换，查找目标栏填如下正则，替换为栏填空，查找模式选择正则表达式，勾选匹配新行，如图:

正则表达式:

^(.*?)$\s+?^(?=.*^\1$)

结果:
在这里插入图片描述
2.excel去重行数据
数据如下：

按照如题选择将筛选结果复制到其他位置，勾选下方的选择不重复的记录

探讨可加扣扣群:866808402

博客等级

码龄8年

53
原创

85
点赞

327
收藏

4217
粉丝

关注

私信

热门文章

分类专栏

shell 3篇
python 14篇
hive 17篇
javase 1篇
每日一题 14篇
java 1篇
linux 1篇
Crawler 1篇
mysql 2篇
工具使用 2篇

展开全部收起

上一篇：: 某指标的次/三/七/十四/三十日留存计算

下一篇：: mysql创建使用存储过程

最新评论

hiveSql 实现计算用户的最大连续登录天数 & 创建断连后的连续序号
WBerica: [code=sql] SELECT type, pt, user, ROW_NUMBER() over(PARTITION by type,flag_1 ORDER BY pt) AS rank FROM (SELECT type, pt, user, sum(flag) over(PARTITION by user ORDER BY pt) AS flag_1 FROM (SELECT type, pt, user, if(type=flag1,0, 1)as flag FROM (SELECT type, pt, user, lag(type,1, type) over(PARTITION by user ORDER BY pt ) AS flag1 FROM tmp ) ) ) ORDER BY pt; [/code]
hiveSql 计算两段时间范围交集的连续每月天数
WBerica: [code=sql] SELECT date_format(tmp_date,'yyyy-MM') AS year_month, username, count(*) AS num FROM (SELECT distinct username, date_add(real_start_time,pos) AS tmp_date FROM (SELECT username, real_start_time, trim(repeat('1 ',datediff(real_end_time,real_start_time) + 1)) AS str FROM (SELECT username, start_time AS vip_start_time, end_time AS vip_end_time, CASE WHEN start_time <= '2021-02-20' THEN '2021-02-20' ELSE start_time END AS real_start_time, CASE WHEN end_time >= '2021-06-15' THEN '2021-06-15' ELSE end_time END AS real_end_time FROM table_name WHERE start_time <= '2021-06-15' AND end_time >= '2021-02-20' ) ) lateral VIEW posexplode (split (str,' ') ) t AS pos, val ) GROUP BY date_format(tmp_date,'yyyy-MM'),username order by username,date_format(tmp_date,'yyyy-MM') [/code]
hiveSql 构建连续日期
@nanami: posexplode 后去的ind 分组内所属组内索引
hiveSql 构建连续日期
2301_79924534: repeat(‘a,’,7)得到的结果不是：a,a,a,a,a,a,a吗，怎么是0,1,2,3,4,5,6,7
hiveSql 相互关注问题
半城烟沙！: 为什么if（from_user>to_user）

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

@nanami 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。