当前位置：首页 > news >正文

Python实现快速将pdf文件剪切成多个图片

news 2026/6/24 23:44:05

这里提供一个打包好的剪切包，window环境打开即可运行

importos

importfitz

importglob

importrequests

os.environ['NLS_LANG']='SIMPLIFIED CHINESE_CHINA.UTF8'

#剪切pdf为图片

defCutPdf(pdfPath,savePath,pdfSavePath):

try:

doc=fitz.open(pdfPath)#pdf路径

forpginrange(doc.pageCount):

page=doc[pg]

rotate=int(0)

# 每个尺寸的缩放系数为2，这将为我们生成分辨率提高四倍的图像。

zoom_x=2.0

zoom_y=2.0

trans=fitz.Matrix(zoom_x, zoom_y).preRotate(rotate)

pm=page.getPixmap(matrix=trans, alpha=False)

imagePath=savePath+'%s.png'%str(pg+1)

pm.writePNG(imagePath)#最终存储路径

newpdfPath=pdfSavePath+'%s.pdf'%str(pg+1)

print("剪切一张图片："+str(pg+1))

frompic2pdf(imagePath,pdfSavePath,newpdfPath)

print("转换成功一张pdf："+str(pg+1))

exceptException as e:

print('CutPdf出现异常:'+str(e))

#图片转pdf

deffrompic2pdf(img_path,pdfSavePath, pdf_path):

# 使用glob读图

forimginsorted(glob.glob(img_path)):

ifnotos.path.exists(pdfSavePath):

os.makedirs(pdfSavePath)

# 打开空文档

doc=fitz.open()

# 打开指定图片

imgdoc=fitz.open(img)

# 使用图片创建单页的PDF

pdfbytes=imgdoc.convertToPDF()

imgpdf=fitz.open("pdf", pdfbytes)

# 将当前页写入文档

doc.insertPDF(imgpdf)

# 保存为指定名称的PDF文件

doc.save(pdf_path)

# 关闭

doc.close()

defmain():

pdfUrl="cards"

fileList=os.listdir(pdfUrl)

index=1

foriteminfileList:

print("开始裁剪"+item)

url=pdfUrl+"/"+item

foldStr="images/"+item.split('.')[0]

url2=foldStr+"/"+item.split('.')[0]

foldStr3="pdf/"+item.split('.')[0]

url3=foldStr3+"/"

ifnotos.path.exists(foldStr):

os.makedirs(foldStr)

CutPdf(url,url2,url3)

print("完成裁剪")

index+=1

if__name__=="__main__":

main()

知识补充

除了上文的方法，小编还为大家整理了其他Python裁剪pdf文件为图片的方法，希望对大家有所帮助

方法一：

剪裁PDF页面

在剪裁PDF页面之前，我们需要获取页面的尺寸，并计算剪裁区域的位置和大小。下面是剪裁PDF页面的代码：

# 获取页面尺寸

page_width=page.mediaBox.getWidth()

page_height=page.mediaBox.getHeight()

# 定义剪裁区域的位置和大小

x=100# 起始点的x坐标

y=100# 起始点的y坐标

width=200# 剪裁区域的宽度

height=300# 剪裁区域的高度

# 剪裁PDF页面

page.trimBox.lowerLeft=(x, y)

page.trimBox.upperRight=(x+width, y+height)

page.cropBox.lowerLeft=(x, y)

page.cropBox.upperRight=(x+width, y+height)

代码解析：

使用mediaBox属性获取页面的宽度和高度。
定义剪裁区域的位置和大小，可以根据实际需求进行调整。
使用trimBox属性设置剪裁后的页面的边界框。
使用cropBox属性设置剪裁后的页面的裁剪框。

保存剪裁后的图片

最后，我们需要将剪裁后的页面保存为图片。这可以通过使用PyPDF2库和Pillow库来实现。下面是保存剪裁后的图片的代码：

fromPILimportImage

# 将剪裁后的页面保存为图片

withopen('output.jpg','wb') as image_file:

page_data=page.extract_xobject().get('/Im0').getData()

image=Image.open(io.BytesIO(page_data))

image.save(image_file,'JPEG')

首先，导入Pillow库中的Image模块，用于处理图像。

使用extract_xobject()方法从剪裁后的页面中提取图像数据。
使用get('/Im0')方法获取图像数据。
使用getData()方法获取图像的二进制数据。
使用Image.open()方法打开图像数据。
使用save()方法保存图像数据为JPEG格式的图片。
'output.jpg'为保存的图片路径，可以根据需要修改。

方法二：

python分割pdf

fromPyPDF2importPdfFileReader, PdfFileWriter

# PDF文件分割

defsplit_pdf(read_file, out_detail):

try:

fp_read_file=open(read_file,'rb')

pdf_input=PdfFileReader(fp_read_file)# 将要分割的PDF内容格式话

page_count=pdf_input.getNumPages()# 获取PDF页数

print(page_count)# 打印页数

withopen(out_detail,'r',True,'utf-8')as fp:

# print(fp)

txt=fp.readlines()

# print(txt)

fordetailintxt:# 打开分割标准文件

# print(type(detail))

pages, write_file=detail.split()# 空格分组

# write_file, write_ext = os.path.splitext(write_file) # 用于返回文件名和扩展名元组

pdf_file=r'C:\Users\GZTSALFIEL\Desktop\excel问题文件\pdf\\'+f'{write_file}.pdf'

# liststr=list(map(int, pages.split('-')))

# print(type(liststr))

start_page, end_page=list(map(int, pages.split('-')))# 将字符串数组转换成整形数组

start_page-=1

try:

print(f'开始分割{start_page}页-{end_page}页，保存为{pdf_file}......')

pdf_output=PdfFileWriter()# 实例一个 PDF文件编写器

foriinrange(start_page, end_page):

pdf_output.addPage(pdf_input.getPage(i))

withopen(pdf_file,'wb') as sub_fp:

pdf_output.write(sub_fp)

print(f'完成分割{start_page}页-{end_page}页，保存为{pdf_file}!')

exceptIndexError:

print(f'分割页数超过了PDF的页数')

# fp.close()

exceptException as e:

print(e)

finally:

fp_read_file.close()

# def main():

# fire.Fire(split_pdf)

#

# if __name__ == '__main__':

# main()

split_pdf(r'..\pdfdocement\myfile.pdf','consult.txt')

到此这篇关于Python实现快速将pdf文件剪切成多个图片的文章就介绍到这了

查看全文

http://www.jsqmd.com/news/664813/

Z-Image Turbo免配置环境实战：快速搭建个人绘画平台

Agent Skill开发：Qwen3-ForcedAligner-0.6B语音助手集成

OFA-VE从部署到应用：开发者用OFA-VE构建自动化内容合规检测工具链

AI编程助手增强：利用StructBERT实现代码注释与文档的语义检索

DAMO-YOLO实战教程：拖拽上传+实时统计，工业级视觉系统轻松上手

用FLUENT验证ICEM网格质量：一个二维混合器流动传热仿真的完整案例复盘

保姆级教程：在RK3588 Android 12.0上开启DEVMEM，让io命令读写寄存器不再报错

保姆级教程：用Streamlit可视化UI，轻松将动漫头像变真人照片

《为什么 10 倍增长比 2 倍更容易》读书笔记：反内卷的指数级增长破局法

Pixel Couplet Gen 惊艳作品集：算法驱动下的传统年俗像素艺术

2026年3月市场口碑好的信息发布系统供应商怎么联系，信息发布一体机/会议预约电子门牌，信息发布系统企业口碑推荐 - 品牌推荐师

Jellyfin豆瓣插件：中文媒体库元数据缺失的终极解决方案

促使深度学习发展的挑战（二十二）

Wan2.2-I2V-A14B在Qt桌面应用中的嵌入：打造本地化视频创作工具

DAMOYOLO-S案例分享：古建筑图像中斗拱/飞檐/彩画构件自动识别

别再只用IsInitialized了！Halcon C++实战：手把手教你写一个健壮的HObject空值判断函数

2026目前靠谱的邓州旧房客厅改造品牌口碑排行榜 - 品牌排行榜

LVGL蒙板遮罩避坑指南：为什么你的ObjectMask总是不显示文字？

从零构建大语言模型特殊 Token 与 BPE 字节对编码 — 让分词器处理任何未知词（五）

快速上手造相-Z-Image-Turbo亚洲美女LoRA：Web服务部署与图片生成指南

G-Helper完整指南：华硕笔记本的轻量级性能优化神器

SDXL 1.0实战：3步生成赛博朋克风格头像，效果惊艳堪比电影截图

Jmeter压测结果文件（.jtl）太大下载慢？试试这招在Linux服务器上直接生成HTML报告

Spring AI集成State Graph实战指南

Hunyuan-MT-7B免配置镜像：内置模型权重+Tokenizer+Chat Template一体化

Hermes Agent 学习笔记

碧蓝航线全自动脚本终极指南：7x24小时解放双手的免费方案

Flutter打包APK时，那个神秘的‘gen_snapshot‘文件去哪了？手把手教你找回并修复

以《毛选》思想破解项目管理困局，实现高效落地

Spring AI智能体实战应用详解

相关文章：