某字段内字符串去重

与传统的数据去重不同,这是一个字段内的字符串有大量重复内容,需要去重

比如字段内容为:aa,bb,cc,dd,ab,aa,cc,dd

去重后的结果为:aa,bb,cc,dd,ab

回复于 2018-07-25 15:55:26 #5 得分:100

模拟SQL:

  1. SELECT 唯一字段,
  2.        LISTAGG(COLUMN_DISTINCT, ',') WITHIN GROUP(ORDER BY COLUMN_DISTINCT) AS 去重字段
  3.   FROM (SELECT DISTINCT 唯一字段, COLUMN_DISTINCT
  4.           FROM (SELECT 唯一字段,
  5.                        REGEXP_SUBSTR(去重字段, '[^,]+', 1, lv) COLUMN_DISTINCT
  6.                   FROM table,
  7.                        (SELECT LEVEL lv FROM dual CONNECT BY LEVEL < 10) b
  8.                  WHERE b.lv <= REGEXP_COUNT(去重字段, '\,') + 1
  9.                  ORDER BY 唯一字段))
  10.  GROUP BY 唯一字段;
### Oracle 中实现分组后字符串拼接并复值的方法 在 Oracle 数据库中,`GROUP_CONCAT DISTINCT` 的替代方案可以通过 `LISTAGG` 和其他辅助函数组合实现。以下是具体方法: #### 方法一:使用 `LISTAGG` 结合子查询 由于 `LISTAGG` 支持直接的 `DISTINCT` 关键字[^3],可以先通过子查询对数据进行处理后再执行 `LISTAGG`。 ```sql SELECT stu_name, LISTAGG(stu_age, ',') WITHIN GROUP (ORDER BY stu_age) AS stu_age_list FROM ( SELECT DISTINCT stu_name, stu_age FROM student ) GROUP BY stu_name; ``` 上述 SQL 查询首先通过子查询中的 `DISTINCT` 对 `(stu_name, stu_age)` 进行操作,然后再利用外部查询调用 `LISTAGG` 函数完成字符串拼接[^2]。 --- #### 方法二:使用 `XMLAGG` 和 `XMLELEMENT` 如果需要更灵活的方式或者目标版本支持 `LISTAGG`(如某些旧版 Oracle),可以考虑使用 `XMLAGG` 配合 `XMLELEMENT` 来实现类似的字符串拼接效果。 ```sql SELECT stu_name, RTRIM( XMLAGG(XMLELEMENT(E, stu_age || ',')).EXTRACT('//text()').GETCLOBVAL(), ',' ) AS stu_age_list FROM ( SELECT DISTINCT stu_name, stu_age FROM student ) GROUP BY stu_name; ``` 此方法的核心在于: 1. 使用子查询对原始表的数据进行; 2. 利用 `XMLAGG` 将每组内的值按顺序拼接为单个字符串; 3. 调整最终结果格式以移除多余的分隔符[^4]。 --- #### 注意事项 - **需求**:无论是哪种方式,都需要显式地在内部子查询阶段应用 `DISTINCT` 或者类似逻辑来确保数据唯一性。 - **字段类型限制**:仅适用于字符型字段;对于数值型字段可能需要转换为字符串形式再参与运算。 - **性能考量**:当数据量较大时,应评估同解决方案之间的效率差异,并优化索引设计以提升查询速度。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值