去除 csv 文件中的重复行

原创于 2021-10-12 10:11:51 发布 · 1.2k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#java #去除重复行

JAVA计算专栏收录该内容

363 篇文章

订阅专栏

这篇博客探讨了如何使用Java读取CSV文件并提取特定列（如CityName）的唯一值。虽然Java标准库对于此任务可能不够直接，但可以借助外部库或SPL脚本简化操作。SPL提供了一种简洁的方法，通过分组和选择第一条记录来去除重复的城市名称。这种方法适用于那些希望在大量重复数据中快速提取不重复值的场景。

【问题】

I have a csv file. columns in csv file - "SNo. StateName CityName AreaName PinCode NonServ.Area MessangerService Remark". The column CityName has repeated values.

Ex: In many records, it has unique value (Delhi). Is there any approach in java to read that csv file and get the distinct values from that column of the csv file.

【回答】

去除重复行是简单的结构化计算，但JAVA缺乏相关的类库，实现过程复杂，代码可读性差。这种情况下可以用SPL辅助实现，代码更直观易懂：

	A
1	=file("E:\\yourfile.csv").import@tc()
2	=A1.group@1(CityName)

A1: @c表示以逗号为分隔符读入文件。@t表示将第一行读为列名。

A2:按CityName分组，取各组第1条记录。该问题的规则没写清楚，这里假设是：如果多条记录里的CityName重复，则保留第1条记录。

关于JAVA集成，参考Java 如何调用 SPL 脚本。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。