本文共 1401 字,大约阅读时间需要 4 分钟。
最近在项目中需要对数据进行插表操作,由于数据量较大,我们不能使用普通的insert into
语句,因为它会引发for循环,而这对公司部门产品流量大、对性能要求高的场景来说是不是太迟缓了。于是我决定采用批量插入的方式来优化数据库操作。
早期的代码大多使用如下方式:
insert into user_info (user_id, user_name, status, years) values (123, '你好', 1, 15);
或者:
insert into user_info set user_id=123, user_name='你好', status=1, years=15;
虽然这种单句插入的方式在批量处理时也需要循环实现:
for(int i=0;i
其中strSql
就是:
insert into user_info (user_id, user_name, status, years) values (123, '你好', 1, 15);
这种方法虽然能实现批量插入,但在大规模数据处理中效率仍不够理想。经过研究和实践,我们最终选择了以下批量SQL实现方案:
insert into user_info (user_id, user_name, status, years) values (123, '你好', 1, 15), (456, '你好', 2, 16);
在实际项目中,插表操作可能会遇到以下情况:当我们不知道需要插入的数据是否已经存在于表中时,可能会导致唯一索引冲突或其他数据库约束问题。这时候就需要合理利用ON DUPLICATE KEY UPDATE
和REPLACE
等功能来解决。
首先分析两种语句的作用和适用场景:
ON DUPLICATE KEY UPDATE:在插入记录时,如果发现唯一索引或主键重复,就执行指定的更新操作;如果没有冲突,就直接插入新记录。这种方法能够保留原记录的其他字段值,只更新指定的字段。
示例:
insert into user_info (user_id, user_name, status, years) values (123, '你好', 1, 15) on duplicate key update user_name = values(user_name);
这意味着当user_id
冲突时,会保留主键user_id
,更改其他字段user_name
,而其他字段值会继承原记录的值。
REPLACE:在插入记录时,如果发现唯一索引或主键重复,就删除存在的记录并插入新值;如果没有冲突,就直接插入新记录。这种方法适用于需要清除旧记录并添加新记录的情形,而且可以在REPLACE
语句中省略into
字眼。
示例:
replace into user_info (user_id, user_name, status, years) values (123, '你好', 1, 15);
当user_id
冲突时,会删除原记录并插入新的数据。如果REPLACE
语句的字段不完整,系统会自动将缺失字段填充为默认值。
在实际应用中,应根据具体需求选择合适的语句。例如,当主键或唯一索引重复时,REPLACE
会彻底删除旧记录并添加新值,但如果需要保留原记录的其他字段值,ON DUPLICATE KEY UPDATE
是更好的选择。
转载地址:http://payhz.baihongyu.com/