当前位置: 首页 > news >正文

Python合并Excel文档

有若干个Excel文档,每个文档格式一致,及第一行为文件标题,第二行为表格表头(表头不完全一致)。现需要将他们合并。

合并规则为:去掉每个文档的第一行,以第二行为表头,将每个文档的第三行及以后的内容合并到一个Excel sheet中,并在第一列添加文档名称。

步骤:

1.将需要合并的数据放进同一个文件夹中(例如:DL-25102-raw data)。

2.使用以下代码运行,将路径改为上面建立的文件夹路径;生成与文件夹同名的Excel合并文件

import pandas as pd import glob import os # 配置路径 input_folder = r"D:\02数据处理\project-26001\project-26001-raw data" output_file = r"D:\02数据处理\project-26001\project-26001-raw data.xlsx" # 获取输入文件夹下所有 .xls 和 .xlsx 文件 file_list = glob.glob(os.path.join(input_folder, "*.xls")) + \ glob.glob(os.path.join(input_folder, "*.xlsx")) if not file_list: print(f"错误:在 {input_folder} 中没有找到任何 Excel 文件,请检查路径。") exit(1) dataframes = [] for file in file_list: df = pd.read_excel(file, header=1) df['Source_File'] = os.path.basename(file) dataframes.append(df) print(f"已读取:{os.path.basename(file)},共 {len(df)} 行") # 合并所有数据 merged_df = pd.concat(dataframes, ignore_index=True, sort=False) # 将 'Source_File' 列移动到第一列 cols = ['Source_File'] + [col for col in merged_df.columns if col != 'Source_File'] merged_df = merged_df[cols] # 输出到目标文件 merged_df.to_excel(output_file, index=False) print(f"合并完成!总行数:{len(merged_df)},已保存至:{output_file}")
http://www.jsqmd.com/news/887046/

相关文章:

  • 2026上半年数据库系统工程师(软考)上午题回忆与解析(非标答版)
  • 2026年山东大学软件学院创新项目实训博客(六)
  • 终极鼠标连点器使用指南:3分钟掌握高效自动化技巧
  • %u的几个格式化输出版本
  • 潮州东方轻奢风全屋高定找哪家
  • 贵阳婚礼西服定制攻略:面料、工艺、版型避坑指南
  • 量子软件测试的挑战与优化策略
  • DeepSeek-R1推理延迟骤降41.8%?独家披露3类硬件感知调度策略(A100/H100/MI300X实测对比数据)
  • 谁懂啊!Win11 部署 OpenClaw 踩过的坑,2.7.5 版本一次性解决
  • Simulink中Repeating Sequence锯齿波显示恒为0解决方案
  • 别再用SonarQube凑数了!DeepSeek原生圈复杂度引擎的6大颠覆性能力(含GitHub私有部署密钥)
  • DDD在DeepSeek场景中失效的7种典型征兆,第5种正在 silently 毁掉你的推理一致性
  • 终极指南:如何用ComfyUI-Manager轻松管理你的AI工作流扩展库
  • Veo 2胶片质感生成器失效?——深度解析Color Science v2.3内核中被屏蔽的Cinematic Grain Injection层
  • 从Sora 2原始张量到可交付MP4:端到端Pipeline中被92%开发者忽略的色彩空间转换断点(BT.2020→BT.709→sRGB三级校准手册)
  • 竞赛题解题方法
  • 基于DINOv2实现特征匹配异常检测
  • PIML技术提升CFD湍流模拟精度:从数据驱动到工程应用实践
  • 沪电股份一季度AI营收62亿元:从英伟达GPU打样到1.6T交换机配套
  • DeepSeek开源协议识别深度解析(MIT/Apache/GPL三协议法律边界大揭秘)
  • 从Dark Channel Prior到AOD-Net:手把手带你复现5个经典图像去雾算法(Python/PyTorch)
  • 【限时解密】Sora 2内部GIF编码协议曝光:如何用Python脚本强制启用LZW+Alpha通道(含GitHub私藏工具包)
  • Midjourney云雾动态演化技巧(雾流速/雾密度/雾边界锐度三维调控法):内含仅限订阅用户获取的雾效时间轴Prompt模板库
  • Midjourney锐化效果失效真相(2024官方未公开的渲染管线瓶颈解析)
  • 完整渗透测试用例表
  • 安居客nsign参数逆向与Unidbg模拟实战
  • YOLO11 改进系列 | 基于 MambaOut 门控框架与 SFSConv 空间频率选择的原创 C3k2_MambaOut_SFSC 模块,适合复杂纹理场景
  • 【算法设计与分析】第7篇:01背包问题的动态规划建模与空间优化
  • Lovable后端集成故障恢复SLA达标率从63%→99.99%:我们重构了3层适配器、替换2个SDK、自研1个协议转换网关(含SLO监控看板截图)
  • Claude本地化部署终极方案(企业级容器化全栈手册):支持Anthropic API兼容、流式响应、模型热切换与RBAC权限隔离