当前位置: 首页 > news >正文

六、处理Word文件的实用操作

添加分页

from docx import Document doc = Document(r"C:\Users\1.docx") # 需要处理文件的位置 doc.add_page_break() #添加分页符 doc.save(r"C:\Users\2.docx") # 添加分页符后文件保存位置

插入图片

doc.add_picture(r"C:\Users\f8.jpg",width=Cm(5),height=Cm(6)) # 设置宽度、高度

添加页眉页脚,页眉添加文字或logo

from docx import Document from docx.shared import Cm, Pt from docx.enum.text import WD_ALIGN_PARAGRAPH, WD_LINE_SPACING from docx.oxml.shared import OxmlElement, qn def fix_header_img_position(doc_path, save_path, header_text, logo_path=None): # def fix_header_img_position(doc_path, save_path, header_text, right_text=None): # 页眉右侧不插入logo,改为文本 """ 调整制表位位置:让图片停在页眉右侧合理区域 """ doc = Document(doc_path) for section in doc.sections: # ========== 1. 页眉置顶的核心边距 ========== section.top_margin = Cm(3.0) section.header_distance = Cm(1.0) # ========== 2. 清空页眉 + 无格式段落 ========== header = section.header header.paragraphs.clear() header_para = header.add_paragraph() header_para.paragraph_format.left_indent = Cm(0) header_para.paragraph_format.right_indent = Cm(1.0) # 页眉整体右缩进1cm,避免图片超页 header_para.paragraph_format.first_line_indent = Cm(0) header_para.paragraph_format.space_before = Pt(0) header_para.paragraph_format.space_after = Pt(0) header_para.paragraph_format.line_spacing_rule = WD_LINE_SPACING.SINGLE # ========== 3. 页眉文字 ========== text_run = header_para.add_run(header_text) text_run.font.name = "宋体" text_run.font.size = Pt(10) text_run.font.position = 0 # ========== 4. 添加logo/文字 ========== if logo_path: #if right_text: #判断是否传右侧文字 # 制表位(适配A4纸) # 偏右,可减小(如14cm);偏左则增大(如17cm) tab_position = Cm(14.7) # Word默认页边距调整值为14.7,显示最合适 header_para.paragraph_format.tab_stops.add_tab_stop(tab_position, WD_ALIGN_PARAGRAPH.RIGHT) header_para.add_run().add_tab() img_run = header_para.add_run() img_run.add_picture(logo_path, width=Cm(2), height=Cm(1)) # 添加右侧文字(替换原图片代码) # right_run = header_para.add_run(right_text) # right_run.font.name = "宋体" # right_run.font.size = Pt(10) # 和左侧文字字号一致 # right_run.font.position = 0 # 垂直置顶 # 图片垂直置顶 r_element = img_run._element rPr_element = r_element.find(qn('w:rPr')) if rPr_element is None: rPr_element = OxmlElement('w:rPr') r_element.append(rPr_element) v_align = OxmlElement('w:vAlign') v_align.set(qn('w:val'), 'top') rPr_element.append(v_align) # ========== 5. 页脚设置 ========== footer = section.footer footer.paragraphs.clear() footer_para = footer.add_paragraph() footer_para.alignment = WD_ALIGN_PARAGRAPH.CENTER footer_para.add_run("第") page_num = OxmlElement('w:fldSimple') page_num.set(qn('w:instr'), 'PAGE') footer_para._p.append(page_num) footer_para.add_run("页 共") total_pages = OxmlElement('w:fldSimple') total_pages.set(qn('w:instr'), 'NUMPAGES') footer_para._p.append(total_pages) footer_para.add_run("页") for run in footer_para.runs: run.font.name = "宋体" run.font.size = Pt(9) doc.save(save_path) print(f"图片位置!保存路径:{save_path}") print(f"若存在偏右/左,调整代码中tab_position的值(14-17cm之间)") # ===================== 调用代码 ===================== if __name__ == "__main__": DOC_PATH = r"C:\Users\测试1.docx" SAVE_PATH = r"C:\Users\测试_图片位置修复.docx" HEADER_TEXT = "XX公司内部文档 | 保密" LOGO_PATH = r"C:\Users\f8.jpg" # 无logo设为None # 传右侧要显示的文字(替换原LOGO_PATH) # RIGHT_TEXT = "2026年第1期" fix_header_img_position(DOC_PATH, SAVE_PATH, HEADER_TEXT, LOGO_PATH)

添加表格

from docx import Document # 1. 打开文档+定义数据源 doc = Document(r"C:\Users\测试.docx") # 写入内容在列表中 list1 = [ ["","",""], ["","",""], ["","",""], ["","",""], ["","",""], ] list2 = [ ["","",""], ["","",""], ["","",""], ["","",""], ["","",""] ] # 2. 封装成通用函数(更简洁,一次封装终身复用) def fill_table(doc, data): """ 用enumerate优化的表格填充函数 :param doc: 文档对象 :param data: 二维列表数据源 :return: 创建的表格对象 """ # 动态获取行数/列数(去掉硬编码,适配任意大小的data) rows_num = len(data) cols_num = len(data[0]) if rows_num > 0 else 0 # 避免空列表报错 # 创建表格 table = doc.add_table(rows=rows_num, cols=cols_num) # 核心优化:用enumerate遍历行(同时拿行索引+行数据) for row_idx, row_data in enumerate(data): # 获取当前行的所有单元格 cells = table.rows[row_idx].cells # 内层优化:用enumerate遍历列(同时拿列索引+列数据) for col_idx, cell_data in enumerate(row_data): cells[col_idx].text = str(cell_data) # 直接用cell_data,不用list1[row][col] return table # 3. 调用函数填充表格 fill_table(doc, list1) doc.add_paragraph("----------------------------------") fill_table(doc, list2) # 4. 保存文档 doc.save(r"C:\Users\测试_添加表格.docx") print("代码运行完成!")

提取表格内容写入Excel

from docx import Document from openpyxl import Workbook # 1. 打开Word文档,获取第一个表格 doc = Document(r"C:\Users\测试.docx") t0 = doc.tables[0] # Word里的第一个表格 # 2. 创建Excel工作簿和工作表 workbook = Workbook() sheet = workbook.active # 3. 正确遍历Word表格,写入Excel for i in range(len(t0.rows)): # 遍历Word表格的每一行 list1 = [] # 初始化:存储当前行的所有单元格内容 # 用len(t0.rows[i].cells)获取当前行的列数 for j in range(len(t0.rows[i].cells)): # 获取当前单元格的文本(去掉多余空格/换行,优化数据) cell_text = t0.cell(i, j).text.strip() list1.append(cell_text) # 把当前列的内容加入行列表 # 内层列循环结束后,一次性append整行数据到Excel sheet.append(list1) # 4. 保存Excel文件 workbook.save(filename=r"C:\Users\测试_提取出表格.xlsx") print("Word表格已成功导出到Excel!")
http://www.jsqmd.com/news/253998/

相关文章:

  • 2026年福建草本基因枪美容仪器公司实力解析:美航草本年轻态 /草本年轻态门店 /草本年轻态门店地址 /美航著妍草本年轻态 /美航草本年轻态加盟多钱机构精选 - 品牌推荐官
  • 2026论文写作AI工具终极测评:全流程提效首选,免费神器认准这款
  • 导师严选2026最新!10款AI论文写作软件测评:专科生毕业论文必备工具
  • 2026福建卫生高级职称该怎么备考?这份通关攻略助你高效突围 - 医考机构品牌测评专家
  • 外包交付加速,XinServer 实操案例解析
  • spaCy从入门到精通:1.1 spaCy简介与特点
  • 2026年工业内窥镜厂家推荐排行榜,管道/旋转/井下/测量/高清/超清内窥镜,专业品牌深度解析与选购指南 - 品牌企业推荐师(官方)
  • 基于VUE的农村帮扶管理系统[VUE]-计算机毕业设计源码+LW文档
  • 楼宇自控系统是什么?和其它控制系统到底有什么区别?
  • 12. Material Design
  • 2026副主任药师考试机构实力榜:三大靠谱选择深度测评与口碑推荐 - 医考机构品牌测评专家
  • 【AI编程工具】-TRAE CN v3.3.21 手把手教你玩转全新Skills技能!
  • 救命神器!9款AI论文平台测评:本科生毕业论文救星
  • 基于VUE的宁新学校学生宿舍管理信息系统[VUE]-计算机毕业设计源码+LW文档
  • 2026年副主任药师考试培训机构深度测评:口碑与实力兼备的选择指南 - 医考机构品牌测评专家
  • 实验课速通SQLServer期末考点五:数据库维护
  • spaCy从入门到精通:1.2 安装与环境配置
  • 2026年音乐放松按摩椅厂家权威推荐榜单:音乐放松椅/体感型音乐放松椅/户外素质拓展箱/团体活动工具箱/活动工具箱源头厂家精选 - 品牌推荐官
  • 福建卫生高级职称备考机构深度解析 - 医考机构品牌测评专家
  • 【2026最新版】迅雷看看下载安装教程|电脑版详细安装步骤 + 常见问题解决 - PC修复电脑医生
  • 赣州市全南宁都于都兴国寻乌石城雅思培训辅导机构推荐:2026权威出国雅思课程中心学校口碑排行榜 - 苏木2025
  • GEO服务商技术对决:谁能为您的AI搜索可见度保驾护航?
  • 基于VUE的猫舍小猫管理系统[VUE]-计算机毕业设计源码+LW文档
  • 2026陕西保安服务公司TOP5精选推荐榜:秩序维护、门卫守护、临时勤务服务 - 深度智识库
  • 海外碳酸镁实力派:2025年厂家排行与优势分析,市场碳酸镁精选实力品牌榜单发布 - 品牌推荐师
  • 1.1 什么是Whisper? | 《Whisper语音识别实战专栏》
  • 2026年全自动洗车机厂家实力推荐榜:隧道式、往复式、公交大巴及工程类智能洗车设备精选,解析无人值守与扫码洗车技术前沿 - 品牌企业推荐师(官方)
  • NopCommerce 4.9.3全栈开发实战 - 4.3 插件生命周期管理
  • 命令行中的 Python 与 Pip:版本之谜与最佳实践指南(python or python3 - pip or pip3)
  • Java SpringBoot+Vue3+MyBatis 学生宿舍信息系统系统源码|前后端分离+MySQL数据库