当前位置：首页 > news >正文

Python+Selenium UI自动化测试实战：从环境搭建到CI/CD集成

news 2026/6/23 15:09:57

1. 项目概述：为什么我们需要UI自动化测试？

在软件开发的迭代周期里，回归测试是个绕不开的体力活。每次发布新版本，测试同学都要把核心功能点再手动走一遍，耗时费力不说，还容易因为疲劳导致漏测。我经历过一个项目，版本后期，光是主流程的冒烟测试就要花掉大半天，测试同学苦不堪言，开发同学也总在等测试反馈。这时候，UI自动化测试的价值就凸显出来了——它能把那些重复、固定、稳定的业务流程，交给代码去执行，把人解放出来去做更有价值的探索性测试和复杂场景验证。

Python + Selenium 的组合，可以说是UI自动化测试领域的“黄金搭档”。Python语法简洁，生态丰富，上手快；Selenium则提供了操控浏览器的标准化接口，支持主流的Chrome、Firefox等。这个组合的优势在于，它不仅仅是写脚本，而是能构建一套可维护、可复用的自动化测试框架。很多新手可能会把自动化测试等同于“录制回放”，但真正的价值在于通过代码设计出健壮的测试用例，处理各种弹窗、等待、断言，并集成到CI/CD流程中，实现无人值守的持续测试。

这个实践项目，就是带你从零开始，搭建一个结构清晰、易于扩展的Python+Selenium UI自动化测试工程。我们会涵盖环境搭建、元素定位策略、等待机制、Page Object设计模式、测试报告生成以及如何集成到Jenkins等核心环节。无论你是刚接触自动化测试的测试工程师，还是想提升项目质量的开发人员，这套实践都能给你提供一条清晰的路径。

2. 环境搭建与核心工具选型

工欲善其事，必先利其器。一个稳定、一致的环境是自动化测试的基石。这里我会详细拆解每一步，并解释为什么这么选。

2.1 Python环境搭建：告别版本混乱

我强烈建议使用Miniconda或Anaconda来管理Python环境，而不是直接安装系统Python。原因很简单：隔离性。不同的项目可能需要不同版本的库，用Conda可以轻松创建独立的虚拟环境，避免库版本冲突。

实操步骤：

下载安装Miniconda：从清华大学开源镜像站下载对应操作系统的Miniconda安装包，安装时记得勾选“Add to PATH”。
创建专属虚拟环境：打开终端（或Anaconda Prompt），执行以下命令。这里指定Python 3.8，因为它是一个在兼容性和稳定性上经过长期考验的版本。
```
conda create -n ui_auto_test python=3.8 conda activate ui_auto_test
```
验证环境：激活环境后，命令行前缀会变成(ui_auto_test)，再运行python --version确认版本。

注意：不要使用系统自带的Python或随意安装的Python。虚拟环境能确保你的项目依赖是干净、可复现的。后续所有pip安装操作，都应在激活的虚拟环境中进行。

2.2 Selenium与浏览器驱动：版本匹配是关键

这是新手最容易踩坑的地方。Selenium库、浏览器驱动（如ChromeDriver）和本地安装的浏览器版本，三者必须匹配。

核心工具安装：

安装Selenium库：在激活的虚拟环境中，运行pip install selenium。建议固定一个稳定版本，如pip install selenium==4.15.0。
管理浏览器驱动——使用WebDriver Manager：手动下载和匹配驱动版本非常麻烦。我推荐使用webdriver-manager这个库，它能自动检测本地浏览器版本并下载对应的驱动。
```
pip install webdriver-manager
```
在代码中，可以这样使用（以Chrome为例）：
```
from selenium import webdriver from selenium.webdriver.chrome.service import Service from webdriver_manager.chrome import ChromeDriverManager service = Service(ChromeDriverManager().install()) driver = webdriver.Chrome(service=service)
```
这样，你就永远不用操心驱动版本问题了。对于Firefox（geckodriver）和Edge，webdriver-manager同样支持。

为什么这么选？

Selenium 4.x：相比3.x，4.x提供了更现代、更清晰的API（如find_element的新写法），并原生支持了相对定位器等新特性，是未来的方向。
WebDriver Manager：极大降低了环境维护成本，特别适合在CI/CD服务器上部署，避免了手动上传驱动文件的繁琐。

2.3 IDE选择：VSCode与PyCharm的权衡

Visual Studio Code (VSCode)：轻量、免费、插件生态强大。通过安装Python、Pytest等插件，完全可以胜任自动化测试开发。适合喜欢轻量化、高定制化的同学。
- 配置要点：安装Python扩展后，在项目根目录下创建.vscode/settings.json，指定Python解释器路径为你的Conda环境路径，这样就能保证运行和调试都在正确的环境中。
PyCharm (Professional版)：功能更全面，对Web开发、Django等支持更好，其专业版对Selenium的调试支持更直观。但社区版对纯Python脚本开发也足够用。

我个人更倾向于VSCode，因为它启动快，与终端集成好，写脚本和做其他事情切换起来更流畅。但对于大型项目或团队统一规范，PyCharm的专业版可能更有优势。

3. 核心技能：元素定位与等待机制

写UI自动化脚本，90%的时间都在和两件事打交道：找到元素，以及等元素出现。这两项基本功不扎实，脚本就会脆弱不堪。

3.1 元素定位策略：八仙过海，各显神通

Selenium提供了8种基本的定位方式。我的策略是：优先级从高到低。

ID定位 (By.ID)：最高优先级。ID通常是唯一的，定位最快、最稳定。只要元素有ID，首选它。
Name定位 (By.NAME)：次选。常用于表单元素，如输入框、单选按钮。
CSS Selector (By.CSS_SELECTOR)：我的主力定位方式。功能强大，语法灵活，性能优于XPath。可以通过id、class、属性及其组合进行定位。
- #username(定位id为username的元素)
- .btn-primary(定位class包含btn-primary的元素)
- input[name='email'](定位name属性为email的input元素)
- div.form-group > label(定位form-group类div下的直接子label)
XPath (By.XPATH)：功能最强大，可以遍历XML/HTML文档的任何节点。当元素没有明显特征时使用。但性能相对较差，且容易因页面结构微小变动而失效。
- 绝对路径：/html/body/div[1]/form/input[2](脆弱，尽量避免)
- 相对路径：//input[@id='kw'](推荐)
- 文本定位：//button[text()='登录']或//button[contains(text(),'登录')]
Class Name, Tag Name, Link Text, Partial Link Text：在特定场景下使用。

实操心得：

不要过度依赖浏览器开发者工具的“Copy XPath”或“Copy selector”。它们生成的路径往往很长、很绝对，极易失效。要学会自己编写简洁、有弹性的CSS Selector或相对XPath。
多用组合定位。例如，一个登录按钮可能有多个，可以用By.CSS_SELECTOR, “button.btn-login[type=‘submit’]”来精确定位。
为关键元素添加易于定位的属性。如果是测试自己公司的产品，可以和前端开发约定，为测试关键元素添加唯一的>driver.implicitly_wait(10) # 单位：秒
- 作用范围：全局，对所有find_element和find_elements生效。
- 缺点：不灵活，无法等待特定条件（如元素可点击、元素消失）。设置过长会影响脚本整体运行速度。
显式等待 (Explicit Wait)：针对某个特定条件进行等待，条件满足则立即继续，超时则抛出异常。这是推荐的主流做法。
```
from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # 等待“登录按钮”出现并且可点击，最多等10秒 login_button = WebDriverWait(driver, 10).until( EC.element_to_be_clickable((By.ID, “loginBtn”)) ) login_button.click()
```
- 核心优势：精准、高效。可以等待各种复杂条件，如：
  - presence_of_element_located(元素出现在DOM)
  - visibility_of_element_located(元素可见)
  - element_to_be_clickable(元素可点击)
  - invisibility_of_element_located(元素消失，如等待加载动画结束)
  - text_to_be_present_in_element(元素包含特定文本)

我的最佳实践：

混合使用，以显式等待为主：在脚本开头设置一个较短的隐式等待（如5秒），作为兜底。对于所有关键操作（点击、输入、获取文本），都使用显式等待包裹。
封装等待操作：将常用的等待逻辑封装成函数或类方法，例如一个wait_for_element_and_click(locator)方法，让代码更简洁。
警惕StaleElementReferenceException：这意味着你之前找到的元素已经不在当前的DOM中了（页面刷新或AJAX更新）。解决方案是重新定位元素，或者使用显式等待来确保元素状态稳定后再操作。

4. 项目架构设计：Page Object Model (POM)

如果所有定位器和操作都堆在一个脚本文件里，很快就会变成难以维护的“面条代码”。Page Object Model (页面对象模型) 是解决这个问题的标准设计模式。

4.1 POM核心思想

一个页面（或一个页面片段）对应一个类。这个类包含：

页面元素定位器：将所有的元素定位方式（如ID、CSS选择器）定义为这个类的属性。
页面操作方法：将对元素的操作（如输入、点击、获取文本）封装成这个类的方法。

这样，测试用例脚本里就不再出现复杂的定位语句，而是清晰的行为描述。

4.2 实战：构建登录页面的Page Object

假设我们有一个登录页面，包含用户名输入框、密码输入框和登录按钮。

1. 创建基础页面类 (base_page.py)：这个类封装一些公共操作，比如初始化driver、公共的等待方法等。

from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC class BasePage: def __init__(self, driver): self.driver = driver self.wait = WebDriverWait(driver, 10) def find_element(self, *locator): """查找单个元素，并加入显式等待""" return self.wait.until(EC.presence_of_element_located(locator)) def find_elements(self, *locator): return self.driver.find_elements(*locator) def click(self, *locator): element = self.wait.until(EC.element_to_be_clickable(locator)) element.click() def input_text(self, text, *locator): element = self.find_element(*locator) element.clear() element.send_keys(text)

2. 创建登录页面类 (login_page.py)：继承BasePage，定义登录页特有的元素和方法。

from selenium.webdriver.common.by import By from .base_page import BasePage class LoginPage(BasePage): # 页面元素定位器 USERNAME_INPUT = (By.ID, “username”) PASSWORD_INPUT = (By.ID, “password”) LOGIN_BUTTON = (By.CSS_SELECTOR, “button[type=‘submit’]”) ERROR_MSG = (By.CLASS_NAME, “alert-error”) # 页面操作方法 def enter_username(self, username): self.input_text(username, *self.USERNAME_INPUT) def enter_password(self, password): self.input_text(password, *self.PASSWORD_INPUT) def click_login(self): self.click(*self.LOGIN_BUTTON) def get_error_message(self): """获取错误提示信息""" try: return self.find_element(*self.ERROR_MSG).text except: return None def login(self, username, password): """一个完整的登录流程""" self.enter_username(username) self.enter_password(password) self.click_login()

3. 在测试用例中使用 (test_login.py)：现在，测试用例变得非常清晰和易读。

import pytest from pages.login_page import LoginPage class TestLogin: def test_login_success(self, driver): # 假设driver通过fixture注入 login_page = LoginPage(driver) login_page.login(“valid_user”, “valid_pass”) # 断言：验证登录后跳转到了首页 assert “dashboard” in driver.current_url def test_login_failed_with_wrong_password(self, driver): login_page = LoginPage(driver) login_page.login(“valid_user”, “wrong_pass”) error_msg = login_page.get_error_message() # 断言：验证出现了正确的错误提示 assert error_msg == “密码错误”

POM模式的好处：

高可维护性：当登录页面的HTML结构改变时，你只需要修改LoginPage类中的定位器，所有测试用例无需改动。
高可读性：测试用例读起来就像自然语言，描述了用户在做什么。
低冗余：公共操作封装在BasePage，避免代码重复。

5. 测试框架集成：Pytest与Allure报告

单纯的脚本运行还不够，我们需要一个测试框架来组织用例、管理前置后置条件、生成漂亮的报告。Pytest是目前Python生态中最主流的测试框架。

5.1 Pytest核心特性应用

用例发现与执行：Pytest能自动发现以test_开头或_test结尾的文件和函数。

Fixture（夹具）：用于提供测试所需的环境和清理工作，比如初始化浏览器、登录状态、关闭浏览器。

import pytest from selenium import webdriver from webdriver_manager.chrome import ChromeDriverManager from selenium.webdriver.chrome.service import Service @pytest.fixture(scope=“function”) # 每个测试函数执行一次 def driver(): service = Service(ChromeDriverManager().install()) _driver = webdriver.Chrome(service=service) _driver.implicitly_wait(5) _driver.maximize_window() yield _driver # 测试函数执行时，使用这个driver _driver.quit() # 测试函数执行完毕后，执行清理工作

scope参数可以是function（默认）、class、module、session，用于控制fixture的生命周期。

参数化：用一组数据驱动同一个测试逻辑，避免写多个重复用例。

import pytest @pytest.mark.parametrize(“username, password, expected”, [ (“”, “123456”, “用户名不能为空”), (“admin”, “”, “密码不能为空”), (“wrong”, “wrong”, “用户名或密码错误”), ]) def test_login_fail_cases(driver, username, password, expected): login_page = LoginPage(driver) login_page.login(username, password) assert login_page.get_error_message() == expected

5.2 生成专业测试报告：Allure

Pytest自带的报告比较简单。Allure可以生成非常直观、美观的交互式HTML报告，展示用例执行情况、步骤、截图、日志等。

配置与使用步骤：

安装Allure：
- 命令行工具：需要从Allure官网下载并配置到系统PATH。
- Python库：pip install allure-pytest
在Pytest中使用：运行测试时，添加--alluredir参数指定结果目录。
```
pytest test_login.py --alluredir=./allure-results
```

生成报告：使用Allure命令行工具将结果文件生成HTML报告。

allure serve ./allure-results # 本地生成并打开一个临时服务查看 # 或 allure generate ./allure-results -o ./allure-report --clean # 生成静态报告文件夹

增强报告内容：在代码中使用Allure装饰器添加更多信息。

import allure @allure.feature(“登录模块”) @allure.story(“用户登录功能”) class TestLogin: @allure.title(“测试使用正确凭据登录成功”) @allure.severity(allure.severity_level.CRITICAL) def test_login_success(self, driver): with allure.step(“打开登录页面”): driver.get(“https://example.com/login”) with allure.step(“输入用户名和密码”): login_page = LoginPage(driver) login_page.login(“user”, “pass”) with allure.step(“验证登录成功”): with allure.step(“检查URL跳转”): assert “dashboard” in driver.current_url with allure.step(“检查用户菜单出现”): assert login_page.is_user_menu_displayed() allure.attach(driver.get_screenshot_as_png(), name=“登录成功截图”, attachment_type=allure.attachment_type.PNG)

这样生成的报告会包含功能模块、用户故事、测试步骤层级和截图，对于排查失败用例非常有帮助。

6. 高级技巧与实战避坑指南

掌握了基础框架后，一些高级技巧和“坑”的应对能让你脚本的稳定性和专业性再上一个台阶。

6.1 处理弹窗、iframe和新窗口/标签页

JavaScript弹窗 (Alert, Confirm, Prompt)：

from selenium.webdriver.common.alert import Alert alert = Alert(driver) print(alert.text) # 获取弹窗文本 alert.accept() # 点击“确定” # alert.dismiss() # 点击“取消” # alert.send_keys(“输入文本”) # 针对Prompt

iframe：在操作iframe内的元素前，必须先切换到该iframe。

# 通过ID或Name切换 driver.switch_to.frame(“iframe_id”) # 操作iframe内的元素... # 操作完成后切回主文档 driver.switch_to.default_content()

新窗口/标签页：

main_window = driver.current_window_handle # 获取当前窗口句柄 # 点击某个打开新窗口的链接... all_windows = driver.window_handles # 获取所有窗口句柄 new_window = [window for window in all_windows if window != main_window][0] driver.switch_to.window(new_window) # 切换到新窗口 # 在新窗口操作... driver.close() # 关闭新窗口 driver.switch_to.window(main_window) # 切回原窗口

6.2 文件上传与下载

文件上传：对于<input type=“file”>元素，直接使用send_keys传入文件绝对路径即可。千万不要尝试模拟点击“选择文件”按钮的复杂操作。
```
upload_element = driver.find_element(By.ID, “file-upload”) upload_element.send_keys(“/Users/yourname/Desktop/test_image.png”)
```

文件下载：需要配置浏览器选项，指定下载路径并禁用下载弹窗。

from selenium import webdriver from selenium.webdriver.chrome.options import Options chrome_options = Options() prefs = { “download.default_directory”: “/path/to/your/download/folder”, “download.prompt_for_download”: False, “download.directory_upgrade”: True, “safebrowsing.enabled”: True } chrome_options.add_experimental_option(“prefs”, prefs) driver = webdriver.Chrome(options=chrome_options)

6.3 常见问题排查与调试技巧

元素定位不到 (NoSuchElementException)：
- 检查：定位器是否正确？页面是否加载完成（用显式等待）？元素是否在iframe里？元素是否被遮挡？
- 调试：在浏览器开发者工具的Console里，用document.querySelector(‘你的CSS选择器’)或$x(‘你的XPath’)手动验证定位器。
脚本在本地跑得通，在服务器上失败：
- 检查：浏览器驱动版本是否匹配服务器上的浏览器版本？服务器是否是无头（headless）环境？页面加载速度是否不同（需要调整等待时间）？
- 方案：使用webdriver-manager统一驱动管理。在无头模式下运行，需添加选项：
```
chrome_options.add_argument(“--headless”) # 无头模式 chrome_options.add_argument(“--disable-gpu”) # 禁用GPU，某些环境需要 chrome_options.add_argument(“--no-sandbox”) # Linux环境常需此参数 chrome_options.add_argument(“--disable-dev-shm-usage”) # 解决共享内存问题
```
如何截屏和录屏？
- 截屏：driver.save_screenshot(‘screenshot.png’)或driver.get_screenshot_as_png()。
- 录屏：Selenium本身不支持。可以考虑使用第三方库（如pyautogui录制屏幕），或者更专业的方案是在CI/CD中使用Docker容器配合录屏工具，或者使用Selenium Grid的第三方插件。

6.4 集成到CI/CD：Jenkins Pipeline示例

自动化测试只有集成到持续集成流程中，才能最大化其价值。以下是一个简单的Jenkins Pipeline脚本示例，用于定时或代码提交后执行测试并发布报告。

pipeline { agent any stages { stage(‘Checkout’) { steps { git ‘https://your-git-repo.git’ } } stage(‘Set up Python’) { steps { sh ‘conda env create -f environment.yml’ // 使用conda环境文件创建环境 sh ‘conda activate ui_auto_test’ } } stage(‘Run Tests’) { steps { sh ‘pytest tests/ --alluredir=allure-results’ } } stage(‘Generate Report’) { steps { script { allure([ includeProperties: false, jdk: ‘’, properties: [], reportBuildPolicy: ‘ALWAYS’, results: [[path: ‘allure-results’]] ]) } } } } post { always { // 无论成功失败，都归档测试结果和截图 archiveArtifacts artifacts: ‘allure-results/**/*’ // 如果失败，可以发送邮件通知 emailext ( subject: “${env.JOB_NAME} - Build #${env.BUILD_NUMBER} - ${currentBuild.result}”, body: “”" 项目：${env.JOB_NAME} 构建号：${env.BUILD_NUMBER} 状态：${currentBuild.result} 报告地址：${env.BUILD_URL}allure/ “”", to: ‘team@example.com’ ) } } }

这个Pipeline定义了标准的流水线：拉取代码 -> 准备Python测试环境 -> 执行Pytest测试并生成Allure结果 -> 利用Jenkins的Allure插件生成并发布报告。最后，无论构建成功与否，都会归档结果并发送邮件通知。通过这样的集成，团队每天都能看到自动化测试的健康状况，快速定位回归缺陷。

查看全文

http://www.jsqmd.com/news/1067882/