Mysql批量插入数据时如何解决重复问题

当数据库中存量数据较多时,或者是在批量插入操作时,很容易出现插入重复数据的问题。

一、三种方法

在 mysql 中,当存在主键冲突或唯一键冲突的情况下,根据插入策略不同,一般有以下三种避免方法:

insert ignore into:若没有则插入,若存在则忽略

replace into:若没有则正常插入,若存在则先删除后插入

insert into ... on duplicate key update:若没有则正常插入,若存在则更新

注意,使用以上方法的前提是表中有一个 PRIMARY KEY 或 UNIQUE 约束/索引,否则,使用以上三个语句没有特殊意义,与使用单纯的 INSERT INTO 效果相同。

测试表结构:

测试表数据:

二、细节

2.1、insert ignore into

insert ignore 会根据主键或者唯一键判断,忽略数据库中已经存在的数据,若数据库没有该条数据,就插入为新的数据,跟普通的 insert into 一样。若数据库有该条数据,就忽略这条插入语句,不执行插入操作。

insert ignore into student(age) values (12),(13);

age=12的数据已存在,因此未插入(根据创建时间可得),age=13的数据不存在,因此成功插入

2.2 、insert into ... on duplicate key update

        在 insert into 语句末尾指定 on duplicate key update,会根据主键或者唯一键判断:若数据库有该条数据,则直接更新原数据,相当于 update,若数据库没有该条数据,则插入为新的数据,跟普通的 insert into 一样。

insert into student(age) values (12),(13) 
ON DUPLICATE KEY UPDATE student.created_at = '2022-01-01 00:00:00';

age=12的记录已存在,因此created_at字段被更新。age=13的记录不存在,因此成功插入

2.3、replace into

 replace into student(age) values (12),(13);

 

age=12的记录已存在,因此被删除重新插入(由createdAt值可知)。age=13的记录不存在,因此成功插入

replace into 会根据主键或者唯一键判断:

  • 若表中已存在该数据,则先删除此行数据,然后插入新的数据,相当于 delete + insert
  • 可能会丢失数据、主从服务器的 AUTO_INCREMENT 不一致。
  • 若表中不存在该数据,则直接插入新数据,跟普通的 insert into 一样

三、总结

1)在主键冲突情况下,三种方法都可以使用

2)在唯一键冲突情况下,且有自增主键时:三种方法都会出现 AUTO_INCREMENT 不连续问题,且这种不连续不会同步更新到 slave 的 AUTO_INCREMENT。当 master 被 kill,且 slave 升级为 master 时,就会出现主键冲突问题。(因为事务原因,即使没有插入成功,也会占用一个自增id。row模式binlog下,主从的数据同步是一致的,主键也一致。有没有影响取决于主从同步模式

  • statement格式:binlog记录的是实际执行的sql语句
  • row格式:binlog记录的是变化前后的数据(涉及所有列),形如update table_a set col1=value1, col2=value2 ... where col1=condition1 and col2=condition2 ...
  • mixed格式:默认选择statement格式,只在需要时改用row格式

3)replace into 方法可能会导致部分数据丢失。

在C#中使用MySql进行批量插入重复数据,可以通过以下步骤实现: 1. 首先,你需要连接到MySql数据库。你可以使用MySql.Data.MySqlClient命名空间中的MySqlConnection类来建立连接。例如: ```csharp string connectionString = "your_connection_string"; using (MySqlConnection connection = new MySqlConnection(connectionString)) { connection.Open(); // 执行插入操作 } ``` 2. 接下来,你需要准备要插入数据。你可以使用INSERT INTO语句来插入数据,同使用ON DUPLICATE KEY UPDATE子句来处理重复数据。这样,当插入数据已经存在,将会更新已存在的数据。例如: ```csharp string insertQuery = "INSERT INTO your_table (column1, column2) VALUES (@value1, @value2) ON DUPLICATE KEY UPDATE column1 = @value1"; using (MySqlCommand command = new MySqlCommand(insertQuery, connection)) { // 设置参数值 command.Parameters.AddWithValue("@value1", value1); command.Parameters.AddWithValue("@value2", value2); // 执行插入操作 command.ExecuteNonQuery(); } ``` 3. 最后,你可以使用循环来批量插入多条数据。例如: ```csharp List<Data> dataList = new List<Data>(); // 假设你有一个包含要插入数据的列表 foreach (Data data in dataList) { using (MySqlCommand command = new MySqlCommand(insertQuery, connection)) { // 设置参数值 command.Parameters.AddWithValue("@value1", data.Value1); command.Parameters.AddWithValue("@value2", data.Value2); // 执行插入操作 command.ExecuteNonQuery(); } } ``` 这样,你就可以使用C#和MySql实现批量插入重复数据了。
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值