去除list集合中重复项的几种方法

本文介绍了使用C#进行列表去重的四种方法,并通过实例展示了如何去除字符串列表中的重复项,包括利用HashSet、双重循环检查、替换重复项为null以及LINQ Distinct方法。
因为用到list,要去除重复数据,尝试了几种方法。记录于此。。。

测试数据:

        List<string> li1 = new List<string> { "8", "8", "9", "9" ,"0","9"};
            List<string> li2 = new List<string> { "张三", "张三", "李四", "张三", "王五", "李四" };
            List<string> li3 = new List<string> { "A", "A", "C", "A", "C", "D" };
            List<string> li4 = new List<string> { "12", "18", "19", "19", "10", "19" };

方法一:

HashSet<string> hs = new HashSet<string>(li1); //此时已经去掉重复的数据保存在hashset中

 

方法二:

复制代码
复制代码
for (int i = 0; i < li2.Count; i++)  //外循环是循环的次数
            {
                for (int j = li2.Count - 1 ; j > i; j--)  //内循环是 外循环一次比较的次数
                {

                    if (li2[i] == li2[j])
                    {
                        li2.RemoveAt(j);
                    }

                }
            }
复制代码
复制代码

 

方法三:

复制代码
复制代码
      //把相同的用null代替。
            for (int i = 0; i < li3.Count; i++)
            {
                for (int j = 0; j < li3.Count; j++)
                {
                    if (i == j) continue;

                    if (li3[i] == li3[j])
                    {
                        li3[j] = "null";
                    }

                }
            }
复制代码
复制代码

 

方法四:

复制代码
复制代码
        //这方法跟上面的一样,只是变了逻辑
            for (int i = 0; i < li4.Count - 1; i++)
            {
                for (int j = 0; j < li4.Count ; j++)
                {
                    if (i != j)
                    {
                        if (li4[i] == li4[j])
                        {
                            li4[j] = "null";
                        }
                    }
                }
            }
复制代码
复制代码

 

最后输出看结果

复制代码
复制代码
        Console.WriteLine("li1去除重复后的值为");
            hs.ToList().ForEach(item => Console.WriteLine(item));

            Console.WriteLine("li2去除重复后的值为");
            li2.ForEach(item => Console.WriteLine(item));

            Console.WriteLine("li3去除重复后的值为");
            li3.ForEach(item => Console.WriteLine(item));

            Console.WriteLine("li4去除重复后的值为");
            li4.ForEach(item => Console.WriteLine(item));
复制代码
复制代码

 

 

null我没去掉。用的时候去掉即可。

 

当然。还有许多办法。比如linq  Distinct  等等都可以,看看网上的这个例子:去掉modelList中title重复的内容,不区分大小写

复制代码
复制代码
 class Program
    {
        static void Main(string[] args)
        {
            List<Model> modelList = new List<Model>() 
            { new Model() { ID = 1, Title = "abcde" },
                new Model() { ID = 2, Title = "ABCDE" },
                new Model(){ ID = 3, Title = "AbcdE" },
                new Model() { ID = 4, Title = "A" }, 
                new Model() { ID = 5, Title = "a" } 
            };
            Console.Read();
        }
    }
    public class Model
    {
        public int ID { get; set; }
        public string Title { get; set; }
    }
复制代码
复制代码

 

解决方案一:这里比较的前提是对象的哈希代码相等。否则不会比较,因为哈希代码不相等。两个对象显然不相等

复制代码
复制代码
//定义一个类继承IEqualityComparer接口
    public class ModelComparer : IEqualityComparer<Model>
    {
        public bool Equals(Model x, Model y)
        {
            return x.Title.ToUpper() == y.Title.ToUpper();
        }
        public int GetHashCode(Model obj)
        {
            return obj.Title.ToUpper().GetHashCode();
        }
    }
复制代码
复制代码

调用:

modelList = modelList.Distinct(new ModelComparer()).ToList();

 

解决方案二:

复制代码
var title = modelList.GroupBy(m => m.Title.ToLower().Trim()).Select(m => new { ID = m.FirstOrDefault().ID });
            modelList = modelList.Where(m => title.Select(mo => mo.ID).Contains(m.ID)).ToList(); 
            foreach (var item in modelList)
            {
                Console.WriteLine(item.ID + "\t" + item.Title);
            }
复制代码

 

当然。如果你仅仅比较两个值是否相等。

 List<string> li1 = new List<string> { "8", "8", "9", "8", "0", "9" };
            li1 = li1.Distinct().ToList();
### 回答问题 在 Java 中,可以使用多种方法去除 `List` 中的复元素。以下是几种常见的实现方式: #### 方法 1:使用 `HashSet` `HashSet` 是一种不允许复元素的数据结构。通过将 `List` 转换为 `HashSet` 再转换回 `List`,可以轻松去除复元素。 ```java import java.util.ArrayList; import java.util.HashSet; import java.util.List; import java.util.Set; public class RemoveDuplicates { public static void main(String[] args) { List<String> list = new ArrayList<>(); list.add("apple"); list.add("banana"); list.add("apple"); list.add("orange"); list.add("banana"); System.out.println("Original List: " + list); List<String> resultList = removeDuplicatesUsingHashSet(list); System.out.println("List after removing duplicates: " + resultList); } public static List<String> removeDuplicatesUsingHashSet(List<String> list) { return new ArrayList<>(new HashSet<>(list)); } } ``` --- #### 方法 2:使用 `Stream` 和 `distinct()` Java 8 引入了 `Stream` API,可以通过 `distinct()` 方法去除复元素。 ```java import java.util.ArrayList; import java.util.List; import java.util.stream.Collectors; public class RemoveDuplicatesWithStream { public static void main(String[] args) { List<String> list = new ArrayList<>(); list.add("apple"); list.add("banana"); list.add("apple"); list.add("orange"); list.add("banana"); System.out.println("Original List: " + list); List<String> resultList = removeDuplicatesUsingStream(list); System.out.println("List after removing duplicates: " + resultList); } public static List<String> removeDuplicatesUsingStream(List<String> list) { return list.stream().distinct().collect(Collectors.toList()); } } ``` --- #### 方法 3:手动遍历并检查 如果不使用集合框架中的现成工具,可以通过手动遍历并检查的方式去除复元素。 ```java import java.util.ArrayList; import java.util.List; public class RemoveDuplicatesManually { public static void main(String[] args) { List<String> list = new ArrayList<>(); list.add("apple"); list.add("banana"); list.add("apple"); list.add("orange"); list.add("banana"); System.out.println("Original List: " + list); List<String> resultList = removeDuplicatesManually(list); System.out.println("List after removing duplicates: " + resultList); } public static List<String> removeDuplicatesManually(List<String> list) { List<String> result = new ArrayList<>(); for (String item : list) { if (!result.contains(item)) { result.add(item); } } return result; } } ``` --- ### 解释 1. **方法 1(`HashSet`)**: - `HashSet` 的底层基于哈希表实现,插入和查找的时间复杂度接近 O(1)。 - 将 `List` 转换为 `HashSet` 后,所有复元素会被自动移除。 - 注意:`HashSet` 不保证元素的顺序。如果需要保留顺序,可以使用 `LinkedHashSet`。 2. **方法 2(`Stream` 和 `distinct()`)**: - `distinct()` 方法会根据对象的 `hashCode()` 和 `equals()` 方法。 - 该方法保留了原始列表中元素的顺序。 - 如果列表中包含自定义对象,需确保正确实现了 `hashCode()` 和 `equals()` 方法。 3. **方法 3(手动遍历)**: - 使用 `List.contains()` 方法逐个检查元素是否已存在于结果列表中。 - 时间复杂度为 O(n²),适用于小型列表或性能要求不高的场景。 --- ### 示例输出 假设输入列表为 `["apple", "banana", "apple", "orange", "banana"]`,程序的输出将是: ``` Original List: [apple, banana, apple, orange, banana] List after removing duplicates: [apple, banana, orange] ``` --- ### 注意事项 - **性能比较**: - 对于大规模数据,`HashSet` 和 `Stream` 的效率更高。 - 手动遍历的方法适合小型列表或需要特殊逻辑的场景。 - **顺序保留**: - 如果需要保留原始列表中元素的顺序,推荐使用 `Stream` 或手动遍历的方法。 - 如果顺序无关紧要,`HashSet` 是最简单高效的选择。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值