当前位置: 首页 > news >正文

Python使用DrissionPage上传文件:从基础到实战指南

在自动化测试和网页爬虫开发中,文件上传是一个常见需求。本文将详细介绍如何使用Python的DrissionPage库实现高效稳定的文件上传操作,涵盖基础原理、核心方法和实战案例。

一、DrissionPage上传文件的核心原理

DrissionPage是一个基于Selenium和Requests的混合驱动库,它简化了浏览器自动化操作。网页中的文件上传通常通过两种方式实现:

  1. 直接操作隐藏的input元素
    大多数网页使用<input type="file">元素实现上传功能,即使前端用美观的按钮覆盖,底层仍依赖该元素。

  2. 处理JavaScript动态生成的上传组件
    部分复杂网页使用JS动态创建上传控件,需要特殊处理。

二、基础文件上传实现

1. 最简上传示例

fromDrissionPageimportChromiumPage# 初始化浏览器page=ChromiumPage()page.get('https://example.com/upload')# 替换为实际上传页面# 直接定位file input并上传file_input=page.e('input[type="file"]')# CSS选择器file_input.send_keys(r'C:\test\sample.jpg')# 发送文件路径

2. 完整流程封装

defupload_file(page,url,file_path):""" 通用文件上传函数 :param page: DrissionPage对象 :param url: 上传页面URL :param file_path: 本地文件路径 :return: 是否上传成功 """try:page.get(url)# 等待上传元素加载(显式等待更可靠)upload_input=page.wait('@input[type="file"]',timeout=10)upload_input.send_keys(file_path)returnTrueexceptExceptionase:print(f"上传失败:{str(e)}")returnFalse

三、实战案例:批量上传图片并处理结果

以下是一个完整的实战案例,实现批量上传图片到百度AI平台并处理识别结果:

importosimportreimporttimeimportrandomfromDrissionPageimportChromiumPage# 配置参数TARGET_DIR=r'G:\验证码项目\抖音九宫格语义点选验证码\图片\temp改名文件夹/'SOURCE_DIR=r'G:\验证码项目\抖音九宫格语义点选验证码\图片\3裁剪后的图片\' UPLOAD_URL='https://chat.baidu.com/search'defprocess_images():# 初始化浏览器page=ChromiumPage()# 确保目标目录存在os.makedirs(TARGET_DIR,exist_ok=True)# 获取所有图片image_files=[fforfinos.listdir(SOURCE_DIR)iff.lower().endswith(('.jpg','.png'))]forimg_nameinimage_files:img_path=os.path.join(SOURCE_DIR,img_name)try:# 上传流程page.get(UPLOAD_URL)# 点击上传按钮(根据实际页面结构调整)upload_btn=page.ele('xpath://div[contains(@class,"upload-btn")]')upload_btn.click()# 操作隐藏的file inputfile_input=page.ele('input[type="file"]')file_input.send_keys(img_path)# 填写表单(示例)textarea=page.ele('textarea[id="chat-textarea"]')textarea.input("请识别图片中的内容,用【】标注结果")# 提交submit_btn=page.ele('img[class*="submit-button"]')submit_btn.click()# 等待结果(根据实际页面调整等待条件)time.sleep(5)# 提取识别结果result_div=page.ele('div[class*="marklang"]')result_text=result_div.textprint(f"识别结果:{result_text}")# 解析结果matches=re.findall(r'【(.*?)】',result_text)ifmatches:# 生成新文件名new_name=f"{matches[0]}_{int(time.time()*1000)}_{random.randint(1000,9999)}.jpg"new_path=os.path.join(TARGET_DIR,new_name)# 移动文件(先删除已存在的同名文件)ifos.path.exists(new_path):os.remove(new_path)os.rename(img_path,new_path)print(f"文件已重命名为:{new_name}")exceptExceptionase:print(f"处理图片{img_name}时出错:{str(e)}")continueif__name__=='__main__':process_images()

四、高级技巧与注意事项

1. 处理动态加载的上传组件

对于使用JavaScript动态生成的上传组件,可以尝试:

# 方法1:先点击触发按钮再操作inputtrigger_btn=page.ele('button[data-action="upload"]')trigger_btn.click()file_input=page.ele('input[type="file"]')# 现在应该可见file_input.send_keys(file_path)# 方法2:直接执行JS触发点击page.run_js('document.querySelector("input[type=file]").click()')

2. 多文件上传

# 支持多选的上传(需页面允许)file_input=page.ele('input[type="file"][multiple]')file_input.send_keys([r'C:\test\file1.jpg',r'C:\test\file2.png'])

3. 等待策略优化

# 更可靠的等待方式fromDrissionPage.commonimportWait# 等待元素出现(最多10秒)upload_input=Wait(page).until(lambdap:p.ele('input[type="file"]'))# 或者使用显式等待page.wait('@input[type="file"]',timeout=10)

4. 常见问题解决

  1. 文件路径问题

    • 始终使用绝对路径
    • Windows路径使用原始字符串(前缀r)或双反斜杠
  2. 元素定位失败

    • 检查元素是否在iframe中(需要先切换)
    • 确认页面是否完全加载
    • 尝试多种定位方式(CSS/XPath)
  3. 浏览器兼容性

    • 确保ChromeDriver版本与浏览器匹配
    • 考虑使用无头模式(options.set_headless()

五、性能优化建议

  1. 复用浏览器实例:避免频繁启动关闭浏览器
  2. 并行处理:使用多线程/多进程处理大量文件
  3. 异常重试机制:对失败操作自动重试
  4. 日志记录:详细记录上传过程和结果

六、总结

DrissionPage提供了简洁高效的文件上传实现方式,通过直接操作隐藏的<input type="file">元素,可以绕过复杂的前端交互逻辑。掌握本文介绍的核心方法和实战技巧后,您可以轻松实现各种文件上传自动化需求。

对于更复杂的场景,建议结合DrissionPage的等待机制、异常处理和JavaScript执行能力,构建健壮的自动化流程。在实际项目中,还应考虑添加进度显示、结果验证和错误恢复等功能,提升用户体验和系统可靠性。

http://www.jsqmd.com/news/215878/

相关文章:

  • 深度学习入门:使用M2FP完成第一个分割项目
  • Nordic的nRF54L系列也推出单片机AI版nRF54LM20B,搭载Axon NPU的新型超低功耗无线SoC
  • 百度搜索关键词优化:M2FP人体解析相关词条排名上升
  • M2FP在低光照条件下表现如何?实测结果显示鲁棒性强
  • 为什么多人解析常出错?M2FP内置拼图算法让Mask合并更精准
  • Kafka和RabbitMQ相比有什么优势?
  • 成功案例|如何进行岗位价值评估?——华恒智信助力某国有数智化中心薪酬改革实例
  • Z-Image-Turbo特殊教育应用:自闭症儿童沟通图像生成工具
  • 对比测试:M2FP在微pe官网风格页面中仍保持高解析稳定性
  • ZYNQ入门指南:ARM+FPGA开发全解析
  • Z-Image-Turbo浮世绘风格日本风情图创作
  • 使用M2FP开发智能姿势矫正应用
  • 没有 Mac 如何在 Windows 上创建 iOS 应用描述文件
  • M2FP支持Windows部署吗?官方镜像兼容主流操作系统
  • 如何用M2FP实现智能舞蹈编排系统?
  • 2026知网降AI工具深度测评
  • Z-Image-Turbo常见问题汇总及解决方案手册
  • 基于M2FP的智能健身教练系统开发实战
  • M2FP性能优化揭秘:ResNet-101骨干网络提升多人检测精度
  • AI伦理思考:人体解析技术应如何规范使用边界
  • 开源人体解析模型对比:M2FP vs主流方案,准确率与稳定性全面评测
  • Z-Image-Turbo抖音挑战赛宣传图生成案例
  • 基于Transformer的轻量化模型在移动端实时语义分割的应用研究
  • API接口怎么写?M2FP Flask服务返回JSON+Base64双格式
  • 2026:当人工智能从屏幕走向街头,我们正在见证一场认知的重塑
  • M2FP模型在多模态任务中的扩展可能性
  • MGeo在社区疫情防控住户信息整合中的实战
  • 虚拟服装设计:M2FP在时尚行业的创新应用
  • 面向非平稳数据流的持续预训练理论与高效算法研究
  • 深度测评!9款AI论文软件助你搞定毕业论文