当前位置：首页 > news >正文

Python使用DrissionPage上传文件：从基础到实战指南

news 2026/3/26 17:33:25

在自动化测试和网页爬虫开发中，文件上传是一个常见需求。本文将详细介绍如何使用Python的DrissionPage库实现高效稳定的文件上传操作，涵盖基础原理、核心方法和实战案例。

一、DrissionPage上传文件的核心原理

DrissionPage是一个基于Selenium和Requests的混合驱动库，它简化了浏览器自动化操作。网页中的文件上传通常通过两种方式实现：

直接操作隐藏的input元素
大多数网页使用<input type="file">元素实现上传功能，即使前端用美观的按钮覆盖，底层仍依赖该元素。
处理JavaScript动态生成的上传组件
部分复杂网页使用JS动态创建上传控件，需要特殊处理。

二、基础文件上传实现

1. 最简上传示例

fromDrissionPageimportChromiumPage# 初始化浏览器page=ChromiumPage()page.get('https://example.com/upload')# 替换为实际上传页面# 直接定位file input并上传file_input=page.e('input[type="file"]')# CSS选择器file_input.send_keys(r'C:\test\sample.jpg')# 发送文件路径

2. 完整流程封装

defupload_file(page,url,file_path):""" 通用文件上传函数 :param page: DrissionPage对象 :param url: 上传页面URL :param file_path: 本地文件路径 :return: 是否上传成功 """try:page.get(url)# 等待上传元素加载（显式等待更可靠）upload_input=page.wait('@input[type="file"]',timeout=10)upload_input.send_keys(file_path)returnTrueexceptExceptionase:print(f"上传失败:{str(e)}")returnFalse

三、实战案例：批量上传图片并处理结果

以下是一个完整的实战案例，实现批量上传图片到百度AI平台并处理识别结果：

importosimportreimporttimeimportrandomfromDrissionPageimportChromiumPage# 配置参数TARGET_DIR=r'G:\验证码项目\抖音九宫格语义点选验证码\图片\temp改名文件夹/'SOURCE_DIR=r'G:\验证码项目\抖音九宫格语义点选验证码\图片\3裁剪后的图片\' UPLOAD_URL='https://chat.baidu.com/search'defprocess_images():# 初始化浏览器page=ChromiumPage()# 确保目标目录存在os.makedirs(TARGET_DIR,exist_ok=True)# 获取所有图片image_files=[fforfinos.listdir(SOURCE_DIR)iff.lower().endswith(('.jpg','.png'))]forimg_nameinimage_files:img_path=os.path.join(SOURCE_DIR,img_name)try:# 上传流程page.get(UPLOAD_URL)# 点击上传按钮（根据实际页面结构调整）upload_btn=page.ele('xpath://div[contains(@class,"upload-btn")]')upload_btn.click()# 操作隐藏的file inputfile_input=page.ele('input[type="file"]')file_input.send_keys(img_path)# 填写表单（示例）textarea=page.ele('textarea[id="chat-textarea"]')textarea.input("请识别图片中的内容，用【】标注结果")# 提交submit_btn=page.ele('img[class*="submit-button"]')submit_btn.click()# 等待结果（根据实际页面调整等待条件）time.sleep(5)# 提取识别结果result_div=page.ele('div[class*="marklang"]')result_text=result_div.textprint(f"识别结果:{result_text}")# 解析结果matches=re.findall(r'【(.*?)】',result_text)ifmatches:# 生成新文件名new_name=f"{matches[0]}_{int(time.time()*1000)}_{random.randint(1000,9999)}.jpg"new_path=os.path.join(TARGET_DIR,new_name)# 移动文件（先删除已存在的同名文件）ifos.path.exists(new_path):os.remove(new_path)os.rename(img_path,new_path)print(f"文件已重命名为:{new_name}")exceptExceptionase:print(f"处理图片{img_name}时出错:{str(e)}")continueif__name__=='__main__':process_images()

四、高级技巧与注意事项

1. 处理动态加载的上传组件

对于使用JavaScript动态生成的上传组件，可以尝试：

# 方法1：先点击触发按钮再操作inputtrigger_btn=page.ele('button[data-action="upload"]')trigger_btn.click()file_input=page.ele('input[type="file"]')# 现在应该可见file_input.send_keys(file_path)# 方法2：直接执行JS触发点击page.run_js('document.querySelector("input[type=file]").click()')

2. 多文件上传

# 支持多选的上传（需页面允许）file_input=page.ele('input[type="file"][multiple]')file_input.send_keys([r'C:\test\file1.jpg',r'C:\test\file2.png'])

3. 等待策略优化

# 更可靠的等待方式fromDrissionPage.commonimportWait# 等待元素出现（最多10秒）upload_input=Wait(page).until(lambdap:p.ele('input[type="file"]'))# 或者使用显式等待page.wait('@input[type="file"]',timeout=10)