mysql数据库中避免重复数据插入

本文介绍如何在不设置唯一索引的情况下防止SQL插入重复数据,包括使用INSERT IF NOT EXISTS的方法,并对比了ON DUPLICATE KEY UPDATE、REPLACE INTO及INSERT IGNORE INTO等不同SQL语句的特点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


首先 数据库中已经存在重复数据 并且数据量很大 之前并没有设置重复字段为唯一索引 
需求: 
修改sql语句在插入时 避免重复插入

网上看了几个博客都是设置唯一索引 使用ignore或者REPLACE INTO 或者ON DUPLICATE KEY UPDATE

on duplicate key update
如果数据存在会触发更新操作 执行后面语句的update 

INSERT INTO tb_addrbook(num,name,mobile) VALUE('1001','小李','13112345678') ON DUPLICATE KEY UPDATE name= '小李',mobile='13112345678'

ON DUPLICATE KEY UPDATE 之后的语句不是条件判断 条件的判断会根据你的唯一索引来判断 触发update之后会执行 UPDATE之后的语句进行更新 如果update之后写的是条件判断的话 就会出现只能插入无法更新的操作

replace into
如果数据存在就删除再插入 

REPLACE INTO `student`(`name`, `age`) VALUES('Jack', 18);

insert ignore into
如果插入时 数据存在则忽略此次插入数据 

INSERT IGNORE INTO `student`(`name`, `age`) VALUES('Jack', 18); 


下面是参考链接: 
https://www.cnblogs.com/Eric-zhao/p/6655994.html

https://blog.youkuaiyun.com/t894690230/article/details/77996355

但是当你的数据库中数据存在重复 重复字段并没有设置唯一索引或者主键的时候上面的语法是无法使用的 后来发现使用 insert if not exists

insert if not exists
INSERT INTO TABLE (field1, field2, fieldn) SELECT 'field1','field2','fieldn' 
FROM 
表名 
WHERE 
NOT EXISTS ( 
SELECT 
* 
FROM 
表名 
WHERE 
字段= ? 
)

 

### 如何在MySQL中防止重复数据插入 为了有效防止重复数据插入,可以采用多种方法和技术手段。以下是几种常见的解决方案: #### 使用唯一约束 (Unique Constraint) 通过定义列上的 `UNIQUE` 约束,数据库会自动拒绝任何试图插入已存在的值的操作[^1]。 例如,在创建表时指定某一列为唯一键: ```sql CREATE TABLE users ( id INT AUTO_INCREMENT PRIMARY KEY, email VARCHAR(255) NOT NULL UNIQUE ); ``` 如果需要向现有表添加唯一约束,则可执行如下语句: ```sql ALTER TABLE users ADD CONSTRAINT unique_email UNIQUE (email); ``` #### 插入前检查是否存在 (SELECT before INSERT) 另一种方式是在尝试插入新记录之前先查询目标字段是否已经存在。这种方法虽然简单易懂,但在高并发场景下可能导致竞态条件(race condition),即两个事务可能同时判断某条记录存在并分别插入相同的数据。 推荐做法是结合事务处理机制来规避此风险: ```sql START TRANSACTION; IF NOT EXISTS(SELECT 1 FROM users WHERE email='example@example.com') THEN INSERT INTO users(email) VALUES('example@example.com'); END IF; COMMIT; ``` #### 利用ON DUPLICATE KEY UPDATE语法 当遇到主键或唯一索引冲突时,该语法允许更新某些特定字段而是抛出错误。 假设我们有一个带有自增ID和邮箱地址作为唯一标识符的用户表,下面的例子展示了如何安全地增加积分而会造成重复账户问题: ```sql INSERT INTO users (id, points, email) VALUES (NULL , 10,'test@test.org') ON DUPLICATE KEY UPDATE points=points+VALUES(points); ``` 这里需要注意的是只有发生违反PRIMARY KEY或者UNIQUE INDEX的情况才会触发UPDATE部分[^3]. #### 考虑覆盖索引(Covering Indexes) 对于频繁读取操作优化来说非常重要的一点就是尽可能减少访问实际存储区次数. 如果能够构建合适的复合索引来满足大部分检索需求的话就可以大大提升效率同时也间接帮助减少了必要的写入动作从而降低了潜在冲突几率[^4]. 综上所述,合理运用上述策略之一即可有效地控制住Mysql中的重复项产生情况.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值