当前位置：首页 > news >正文

别再一条条插数据了！用pymysql的executemany()批量操作，让你的Python脚本快100倍

news 2026/6/4 15:35:44

从13秒到0.17秒：揭秘pymysql批量插入的性能飞跃

凌晨三点的办公室，咖啡杯早已见底，屏幕上的Python脚本还在缓慢地逐条插入数据。这是我上周的真实经历——一个本应简单的数据迁移任务，因为使用了传统的execute()方法，硬是拖成了通宵加班。直到我发现executemany()这个神器，2万条数据的插入时间从13秒骤降到0.17秒，那一刻的震撼至今难忘。如果你也经常与MySQL和大量数据打交道，这篇文章将彻底改变你的工作效率。

1. 为什么你的数据库操作这么慢？

很多开发者第一次接触pymysql时，都是从execute()方法开始的。这个看似无害的单条插入操作，在面对批量数据时却会成为性能杀手。让我们先解剖这个"慢动作"背后的真相。

每次execute()调用时，实际上发生了这些隐藏操作：

应用程序与MySQL服务器建立通信
SQL语句通过网络传输到服务器
服务器解析SQL并生成执行计划
执行插入操作
返回结果给客户端
等待下一次调用

# 典型的低效插入模式 for row in data: cursor.execute("INSERT INTO table VALUES (%s, %s)", row)

当循环执行2万次这样的操作，就相当于重复了2万次完整的请求-响应流程。更糟的是，默认的autocommit模式会让每个插入都触发磁盘I/O，进一步拖慢速度。

实测数据：在相同环境下插入2万条记录
execute()逐条插入：13.6秒
executemany()批量插入：0.17秒

2. executemany()的工作原理与性能魔法

这个看似简单的API背后，其实是一套精妙的批量处理机制。当调用executemany()时，pymysql会：

将多条数据打包成一个批处理请求
使用预处理语句（prepared statement）减少SQL解析开销
自动优化事务处理，默认只在最后提交一次
利用网络协议的多值插入特性减少通信次数

# 高效批量插入的正确姿势 data = [(1, 'a'), (2, 'b'), (3, 'c')] # 必须是元组列表 sql = "INSERT INTO table (id, value) VALUES (%s, %s)" cursor.executemany(sql, data)

关键参数对比：

特性	execute()	executemany()
网络往返次数	N次	1次
SQL解析次数	N次	1次
事务提交	N次(默认)	1次
内存占用	低	中等

3. 实战中的高级技巧与避坑指南

掌握了基础用法后，下面这些实战经验能让你真正发挥executemany()的威力：

3.1 数据预处理技巧

列表生成优化：避免在内存中构建超大列表

# 不好的做法：先生成全量列表 huge_list = [tuple(x) for x in some_large_iterable] # 更好的做法：使用生成器 def data_generator(): for item in some_large_iterable: yield tuple(item[:2])

分批插入策略：应对超大数据集

batch_size = 1000 for i in range(0, len(data), batch_size): batch = data[i:i + batch_size] cursor.executemany(sql, batch) conn.commit() # 分批提交防止内存溢出

3.2 特殊场景处理

遇到重复键更新时，很多人会犯这个错误：

# 错误写法：会导致参数不匹配 sql = """ INSERT INTO table (id, value) VALUES (%s, %s) ON DUPLICATE KEY UPDATE value = %s """

正确的做法是使用VALUES()函数：

# 正确写法 sql = """ INSERT INTO table (id, value) VALUES (%s, %s) ON DUPLICATE KEY UPDATE value = VALUES(value) """

4. 性能对比：不只是插入速度的提升

为了全面评估批量插入的优势，我们在不同数据量下进行了对比测试：

测试环境：

MySQL 8.0
Python 3.9
pymysql 1.0.2
本地连接，排除网络延迟影响

数据量	execute()耗时	executemany()耗时	性能提升倍数
1,000	0.68s	0.012s	56x
10,000	6.84s	0.098s	69x
50,000	34.21s	0.41s	83x
100,000	72.53s	0.89s	81x

从数据可以看出，随着数据量增加，批量插入的优势更加明显。这是因为固定开销（连接建立、SQL解析等）被分摊到更多数据上。

5. 哪些场景最适合使用批量插入？

根据实际项目经验，这些场景特别适合使用executemany()：

数据迁移工具：将数据从旧系统导入新系统时
日志处理系统：需要快速存储大量日志条目
爬虫数据存储：批量保存抓取的结构化数据
监控数据持久化：高频采集的指标数据存储
ETL流程：数据转换后的批量加载阶段

一个真实的案例：某电商平台的商品价格更新系统，原本需要5分钟完成的10万条价格更新，改用批量插入后缩短到3秒内完成，使促销活动配置更加实时。

6. 进阶：与其他优化手段配合使用

单独使用executemany()已经能获得巨大提升，但结合这些技巧还能更进一步：

调整MySQL参数：

SET GLOBAL max_allowed_packet=256M; -- 增大允许的数据包大小 SET GLOBAL innodb_buffer_pool_size=2G; -- 增加缓冲池

使用LOAD DATA INFILE：对于超大数据集（百万级+）

# 先将数据写入CSV df.to_csv('temp.csv', index=False) # 使用MySQL原生加载命令 cursor.execute(""" LOAD DATA LOCAL INFILE 'temp.csv' INTO TABLE target_table FIELDS TERMINATED BY ',' LINES TERMINATED BY '\n' """)

连接池管理：避免频繁创建连接的开销

from pymysql import ConnectionPool pool = ConnectionPool(5, host='localhost', user='root') conn = pool.get_conn()

在最近的一个物联网项目中，结合批量插入和连接池技术，我们成功将传感器数据的存储吞吐量从每秒200条提升到9500条，完全满足了业务高峰期的需求。

查看全文

http://www.jsqmd.com/news/650822/

Gemini 应用登陆 Mac：免费下载，开启快捷集成的桌面 AI 体验！

企业数字化转型中的技术架构演进路径与方法论

3步掌握TurboVNC：高性能远程图形渲染的终极部署指南

2026年遵义烧机油治理与汽车美容贴膜：底盘维修深度横评指南 - 精选优质企业推荐榜

渗透写ssh公钥证书登录

别再手动刷新了！用QtChart+QTimer实现实时数据流曲线（附完整源码）

W25QXX系列选型指南：从W25Q80到W25Q256的5个关键参数对比（附典型电路）

开超市做门头都需要注意那几点

AI 1M 上下文时代，你的 session 管理正在悄然决定编码天花板

鑫豪迈基本信息大揭秘，客户群体广泛度究竟如何 - 工业品网

如何快速掌握Common Voice：面向开发者的终极实战指南

云原生可观测性

如何3分钟搞定CAJ转PDF：学术研究者的终极格式转换方案

索尼相机终极解锁指南：OpenMemories-Tweak完全使用教程

Xray实战指南：从基础扫描到精准漏洞探测

2026美萌科技：小程序定制开发经验丰富，覆盖零售金融等多行业场景 - 品牌种草官

博士论文盲审前必做的10项自查清单（附送审流程与避坑指南）

how to configure hermes agent

Linux系统+用户+文件（中）

2026年3月国内间歇式智适应动力模块品牌，直膨式防爆空调机组/离子光触媒净化器，间歇式智适应动力模块生产商实力 - 品牌推荐师

2026年遵义烧机油治理、贴膜车衣深度横评与官方联系指南 - 精选优质企业推荐榜

R语言实战：用mice包搞定数据缺失多重插补，让你的模型结果更稳健（附完整代码与结果解读）

恒歌科技：自主可控军事仿真与 GIS 可视化双引擎，领跑国防数字化新征程 - 深度智识库

Ubuntu 18.04上CUDA 10.2与CUDNN 7.6.5的保姆级安装避坑指南（含图形界面关闭与恢复）

3步实现Win11系统深度优化：从臃肿到高效的专业指南

全国瓷绝缘子哪家好?2026全国瓷绝缘厂家推荐:直流绝缘子厂家+盘形悬式瓷绝缘子厂家+盘形悬式瓷绝缘子品牌推荐 - 栗子测评

从DispatcherServlet到Controller：Spring MVC请求映射失效的排查与修复指南

Rockchip RK3588 - Recovery模式下的updateEngine与rkupdate升级机制深度解析

2026年新疆乌鲁木齐家装工装一体化服务深度横评：透明报价与本地气候适配指南 - 精选优质企业推荐榜