OpenClaw 文档处理Skill
OpenClaw 的文档处理核心是三大内置技能:PDF全能处理、Office自动化、文本批量处理,搭配本地OCR与数据提取,用自然语言即可驱动批量转换、数据抓取与格式规整,无需编程。
一、核心技能总览(内置/免费)
1. PDF全能处理(pdf-smart-tool-cn)
格式转换:PDF ↔ Word/Excel/Text/图片
批量操作:合并、拆分、加水印、加密、提取图片
OCR识别:扫描件/图片PDF文字提取(中文/英文)
数据提取:表格识别、关键词定位、发票/合同结构化抓取
常用指令
把桌面所有PDF合并为"汇总.pdf" 将"发票文件夹"PDF转Excel并提取金额 OCR识别"扫描件.pdf"并保存为可编辑Word2. Office/WPS自动化(office-document-specialist-suite)
Word:生成合同/周报、批量替换文字、统一字体/排版、段落重组
Excel:数据筛选、公式计算、多表合并、生成图表、批量汇总
模板驱动:按模板批量生成简历/报告/公文
常用指令
生成一份标准劳动合同(A4、宋体小四) 把文档中所有"旧公司"替换为"新公司" 合并"销售数据"下所有Excel并计算总和3. 文本批量处理(text-processor)
内容清洗:去重、去空行、繁简转换、中英互译
摘要/大纲:长文自动提炼重点、生成思维导图
格式转换:TXT/MD/HTML互转,清理冗余标签
二、高级技能(推荐安装)
1. 结构化数据提取(data-extractor)
模板定义:框选固定位置(锚点/区域),指定字段类型(文本/数字/日期)
批量抓取:发票、订单、流水、入职表等统一格式文档
输出:直接存Excel/CSV,可导入数据库
2. 文档对比与修订(doc-compare)
差异高亮:Word/PDF/文本间对比,标注增删改
版本合并:多版本文档一键合并,保留修订痕迹
三、技能启用与配置
打开OpenClaw → 技能商店 → 搜索技能名 → 启用
基础必开:pdf-smart-tool-cn、office-document-specialist-suite、text-processor
高级可选:data-extractor、doc-compare、ocr-local
四、实战组合案例
案例1:财务发票批量处理
使用pdf-smart-tool-cn处理"桌面/发票"下所有PDF: 1. 提取发票号码、日期、不含税金额、销售方 2. 用office-document-specialist-suite生成Excel并汇总 3. 保存为"2026-04发票汇总.xlsx"案例2:合同批量生成与修订
1. 用office-document-specialist-suite生成10份劳动合同(替换员工姓名) 2. 用doc-compare对比新旧版本,高亮修改处 3. 批量转PDF并加盖水印"内部专用"五、常见问题
扫描PDF无法提取文字:启用ocr-local技能,需联网下载模型
Excel复杂表格识别不准:优先用data-extractor定义模板,精度更高
技能加载失败:检查~/.openclaw/skills权限,重启客户端
六、最佳实践
批量任务优先用自然语言组合指令,减少手动操作
固定格式文档(发票/订单)提前做提取模板,重复使用
大文件(>100MB)分批处理,避免内存溢出
(注:文档部分内容可能由 AI 生成)
