【问题】
I have a csv file. columns in csv file - "SNo. StateName CityName AreaName PinCode NonServ.Area MessangerService Remark". The column CityName has repeated values.
Ex: In many records, it has unique value (Delhi). Is there any approach in java to read that csv file and get the distinct values from that column of the csv file.
【回答】
去除重复行是简单的结构化计算,但JAVA缺乏相关的类库,实现过程复杂,代码可读性差。这种情况下可以用SPL辅助实现,代码更直观易懂:
| A | |
| 1 | =file("E:\\yourfile.csv").import@tc() |
| 2 | =A1.group@1(CityName) |
A1: @c表示以逗号为分隔符读入文件。@t表示将第一行读为列名。
A2:按CityName分组,取各组第1条记录。该问题的规则没写清楚,这里假设是:如果多条记录里的CityName重复,则保留第1条记录。
关于JAVA集成,参考Java 如何调用 SPL 脚本。
这篇博客探讨了如何使用Java读取CSV文件并提取特定列(如CityName)的唯一值。虽然Java标准库对于此任务可能不够直接,但可以借助外部库或SPL脚本简化操作。SPL提供了一种简洁的方法,通过分组和选择第一条记录来去除重复的城市名称。这种方法适用于那些希望在大量重复数据中快速提取不重复值的场景。
686

被折叠的 条评论
为什么被折叠?



