当前位置：首页 > news >正文

Selenium与ChromeDriver自动化测试：从环境搭建到POM框架实战

news 2026/6/30 20:43:18

1. 项目概述：为什么自动化测试是开发者的必修课

在软件开发的日常里，我们常常会陷入一个循环：新功能上线前，手动点击几十个页面，填写上百个表单，验证各种边界条件。这不仅枯燥耗时，而且极易出错，尤其是在回归测试阶段，一个微小的改动就可能引发连锁反应。我见过太多团队因为测试不充分，导致线上事故频发，最终陷入“救火-修复-再救火”的恶性循环。自动化测试，尤其是基于浏览器操作的UI自动化，就是打破这个循环的关键钥匙。它能让机器代替我们执行那些重复、繁琐的点击和验证工作，把人力解放出来去做更有创造性的任务，比如探索性测试和架构设计。

而在这个领域，Selenium与ChromeDriver的组合，无疑是当前最主流、最成熟的技术栈。Selenium提供了一个统一的API，让我们可以用Python、Java、C#等多种语言编写测试脚本，去控制各种浏览器。ChromeDriver则是一个独立的服务，它充当了Selenium WebDriver与Google Chrome浏览器之间的“翻译官”和“指挥官”。简单来说，你的代码告诉Selenium“点击这个按钮”，Selenium通过WebDriver协议把指令发给ChromeDriver，ChromeDriver再通过Chrome的调试协议（Chrome DevTools Protocol）最终驱动真实的Chrome浏览器完成点击动作。这套组合拳的强大之处在于，它模拟的是真实用户的操作，测试环境与生产环境高度一致，发现的bug也更具价值。

掌握这套技巧，不仅仅是学会几个API调用。它意味着你能构建可维护、可扩展的自动化测试套件，能精准定位页面元素，能优雅地处理各种弹窗、等待和异步加载，甚至能应对一些基础的反爬机制。无论是测试工程师提升效率，还是开发工程师实现“测试左移”，保证自己代码的质量，这都是不可或缺的核心技能。接下来，我将从一个实践者的角度，带你从环境搭建到高级技巧，彻底吃透这套工具链。

2. 环境搭建与核心组件解析

2.1 ChromeDriver：浏览器与代码的桥梁

很多人第一步就卡在了ChromeDriver的下载和配置上，网络上充斥着过时的下载地址和版本不匹配的报错信息。首先必须明确一个核心原则：ChromeDriver的版本必须与您本地安装的Chrome浏览器主版本号完全一致。比如你的Chrome是 128.0.6613.138，那么你就需要下载主版本号为128的ChromeDriver。

去哪里下载？最稳妥的方式是访问ChromeDriver的官方存储仓库。你可以直接搜索“ChromeDriver Storage”找到谷歌的官方托管站点。对于国内用户，如果访问不畅，一些大型的镜像站（如淘宝的NPM镜像）也可能提供下载，但务必核对文件哈希值以确保安全。我不建议从任何个人网盘或来路不明的网站下载，以免引入安全风险或恶意软件。

下载后，你需要将ChromeDriver的可执行文件（如chromedriver.exe或chromedriver）放在一个合适的位置。有三种常见的配置方法：

添加到系统PATH：这是最通用的方法。将文件所在目录添加到系统的环境变量PATH中。这样，无论在哪个目录下运行脚本，系统都能找到它。
指定绝对路径：在代码中初始化WebDriver时，直接传入chromedriver的完整文件路径。这种方式简单直接，但不利于脚本的跨环境迁移。
使用第三方管理工具：例如Python的webdriver-manager库。这是一个非常优雅的解决方案，它可以在运行时自动检测你的Chrome版本，并下载、配置匹配的ChromeDriver。你只需要pip install webdriver-manager，然后在代码中稍作调整即可，彻底告别手动管理版本的烦恼。

注意：浏览器经常会自动更新，而你的ChromeDriver不会。因此，最常见的错误“This version of ChromeDriver only supports Chrome version XXX”往往就是因为浏览器升级后驱动版本落后了。使用webdriver-manager是解决此问题的最佳实践。

2.2 Selenium WebDriver：统一的控制协议

Selenium的核心是WebDriver。WebDriver是一个W3C标准，它定义了一套用于远程控制网页浏览器的协议和接口。你可以把它想象成浏览器的“遥控器”。Selenium为这个“遥控器”提供了多种编程语言的客户端库（如seleniumfor Python,Selenium.WebDriverfor C#）。

安装Selenium非常简单，以Python为例，只需一条命令：pip install selenium。这里有一个关键点：尽量在虚拟环境（如venv, conda）中安装和管理这些依赖，以避免不同项目间的包版本冲突。

WebDriver的工作原理是“客户端-服务器”模式。当你写下driver = webdriver.Chrome()这行代码时，背后发生了以下几步：

启动ChromeDriver服务器进程（一个独立的.exe或二进制文件）。
Selenium客户端库（你的代码）通过HTTP请求（默认端口9515）与这个服务器通信。
服务器接收指令（如“打开百度”、“查找搜索框”），通过CDP与真实的Chrome浏览器进程交互，并返回结果。

理解这个架构有助于后续调试。例如，当浏览器无响应时，你可能需要去检查ChromeDriver服务器的日志，或者考虑是否是网络代理设置导致了通信问题。

2.3 初始化驱动与基础配置

一个健壮的自动化脚本，始于一个配置得当的浏览器驱动实例。直接使用webdriver.Chrome()是最简单的方式，但生产环境的脚本通常需要更精细的控制。

from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.webdriver.chrome.options import Options # 1. 配置Chrome选项 chrome_options = Options() # 常用配置示例 chrome_options.add_argument('--headless') # 无头模式，不显示GUI，用于服务器 chrome_options.add_argument('--disable-gpu') # 禁用GPU加速，在某些环境下更稳定 chrome_options.add_argument('--no-sandbox') # 绕过沙箱，常用于Docker或CI环境 chrome_options.add_argument('--disable-dev-shm-usage') # 解决共享内存问题 chrome_options.add_argument('--window-size=1920,1080') # 设置初始窗口大小 chrome_options.add_experimental_option('excludeSwitches', ['enable-logging']) # 禁用控制台无关日志 # 2. 使用webdriver-manager自动管理驱动（推荐） from webdriver_manager.chrome import ChromeDriverManager service = Service(ChromeDriverManager().install()) # 或者，手动指定驱动路径 # service = Service(executable_path='/path/to/your/chromedriver') # 3. 初始化驱动实例 driver = webdriver.Chrome(service=service, options=chrome_options) # 4. 全局隐式等待（非必需，谨慎使用） driver.implicitly_wait(10) # 设置查找元素时的最大等待时间（秒）

配置解析与避坑指南：

无头模式（Headless）：在CI/CD流水线或服务器上运行测试时必备。但要注意，有些网站在无头模式下行为可能与有界面模式不同，可能需要额外添加--user-agent参数来模拟真实浏览器。
--no-sandbox与--disable-dev-shm-usage：这是在Linux系统（特别是Docker容器）中运行Chrome的常见参数，用于解决权限和资源限制问题。在Windows或macOS个人开发机上通常不需要。
隐式等待 vs. 显式等待：上面代码中的implicitly_wait是一种全局等待策略，它会在查找元素时，如果元素未立即出现，会轮询等待至多10秒。这看似方便，但副作用很大。它会为所有的find_element操作增加等待时间，可能导致脚本在元素确实不存在时也要白白等待10秒，拖慢失败用例的执行速度。因此，更推荐使用后面会讲到的“显式等待”。

3. 元素定位：自动化测试的基石

自动化测试的本质是模拟人对UI元素的操作。因此，精准、稳定地定位到页面元素是第一步，也是最容易出问题的一步。

3.1 八大定位策略详解

Selenium提供了8种基本的定位策略，每种都有其适用场景。

ID定位 (By.ID)：通过元素的id属性定位。这是优先级最高的定位方式，因为ID在HTML中理应是唯一的。定位速度快，稳定性极高。driver.find_element(By.ID, “username”)。
Name定位 (By.NAME)：通过元素的name属性定位。常用于表单元素。driver.find_element(By.NAME, “password”)。
ClassName定位 (By.CLASS_NAME)：通过元素的class属性定位。一个元素可以有多个class，此处填写其中一个即可。但class通常不唯一，需谨慎使用。driver.find_element(By.CLASS_NAME, “btn-submit”)。
TagName定位 (By.TAG_NAME)：通过HTML标签名定位，如input,div,a。通常用于查找一组同类元素。driver.find_elements(By.TAG_NAME, “a”)。
LinkText与PartialLinkText (By.LINK_TEXT,By.PARTIAL_LINK_TEXT)：专门用于定位超链接 (<a>标签)。LinkText需要完全匹配链接文本，PartialLinkText只需部分匹配。driver.find_element(By.LINK_TEXT, “忘记密码？”)。
CSS Selector定位 (By.CSS_SELECTOR)：功能最强大、最灵活的定位方式。它使用CSS选择器语法，可以组合ID、Class、属性、层级关系等进行精确定位。例如：#container > .list li:nth-child(2)。学习基础CSS选择器语法对自动化测试至关重要。
XPath定位 (By.XPATH)：功能同样强大，通过XML路径语言来定位元素。它可以在整个HTML文档树中进行导航，定位能力极强，甚至能根据文本内容定位。例如：//input[@id=‘kw’]或//button[contains(text(), ‘登录’)]。

3.2 定位策略选择心法

在实际项目中，我遵循以下优先级选择定位器：

首选ID：如果元素有唯一且稳定的ID，毫不犹豫用它。
次选Name：对于表单域，Name通常也是不错的选择。
慎用Class和TagName：除非用于获取元素列表，否则单独使用它们很容易因页面样式调整而失效。
CSS Selector与XPath是主力：当ID和Name不可用时，这两者是首选。它们之间的选择有点“门派之争”。
- CSS Selector：通常性能稍好，语法更简洁，对于基于Class、属性、层级关系的定位写起来很快。浏览器原生支持，解析速度快。
- XPath：功能更全面，尤其擅长基于文本定位和在DOM树中上下遍历（如查找父节点、祖先节点）。但表达式可能更复杂，性能在极端复杂的DOM下可能略逊于CSS。
黄金法则：定位器应该尽可能简洁、具有唯一性，并且与页面UI的实现细节（如具体样式、布局结构）耦合度越低越好。避免使用包含绝对位置、索引（如div[3]/div[5]/span[2]）或频繁变化的样式类名的XPath/CSS。

3.3 高级定位与等待策略

直接使用find_element在动态网页中经常会遇到NoSuchElementException，因为元素可能尚未加载出来。这时就需要“等待”。

1. 显式等待（Explicit Wait）：这是处理动态加载元素的推荐方式。它针对某个特定条件进行等待，条件满足则立即返回，超时则抛出异常。它不会影响其他操作。

from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # 等待最多10秒，直到ID为‘dynamicContent’的元素可见 element = WebDriverWait(driver, 10).until( EC.visibility_of_element_located((By.ID, “dynamicContent”)) ) # 等待元素可被点击 button = WebDriverWait(driver, 10).until( EC.element_to_be_clickable((By.CSS_SELECTOR, “.submit-btn”)) ) # 等待元素在DOM中存在（不一定可见） element_present = EC.presence_of_element_located((By.NAME, “q”))

expected_conditions模块提供了大量预定义条件，如标题包含某文字、弹窗出现、元素被选中等，非常实用。

2. 实战中的定位技巧：

组合定位：driver.find_element(By.CSS_SELECTOR, “form#loginForm input[name=‘user’]”)
处理动态ID：如果ID是动态生成的（如id=“message-12345”），可以使用属性部分匹配：driver.find_element(By.CSS_SELECTOR, “[id^=‘message-’]”)(CSS以...开头) 或driver.find_element(By.XPATH, “//*[starts-with(@id, ‘message-’)]”)。
使用开发者工具：Chrome DevTools的Elements面板，右键点击元素，选择“Copy” -> “Copy selector” 或 “Copy XPath”，可以快速获取定位器，但一定要人工检查其简洁性和稳定性，自动生成的路径往往又长又脆弱。

4. 核心操作与浏览器控制

定位到元素后，我们就可以对其进行各种操作，模拟真实用户行为。

4.1 基础用户交互操作

这些操作构成了自动化脚本的“血肉”。

点击与清空：

element.click() # 点击 element.clear() # 清空输入框内容

输入文本：
```
element.send_keys(“your text here”) # 输入文本 element.send_keys(Keys.CONTROL, ‘a’) # 模拟快捷键，如全选 element.send_keys(Keys.ENTER) # 模拟回车键
```
注意：send_keys前最好先clear()一下，避免原有内容干扰。对于某些React或Vue构建的富文本应用，直接send_keys可能无效，可能需要先click()聚焦，或者使用ActionChains（下文介绍），甚至需要通过执行JavaScript来设置值。

获取元素状态与信息：

text = element.text # 获取元素可见文本 attr = element.get_attribute(“href”) # 获取属性值，如href, value, class is_displayed = element.is_displayed() # 元素是否可见 is_enabled = element.is_enabled() # 元素是否可用（可点击/输入） is_selected = element.is_selected() # 复选框/单选框是否被选中

element.text是获取用户能看到的内容，而.get_attribute(“innerHTML”)或.get_attribute(“value”)用于获取原始HTML或表单值，用途不同。

4.2 高级交互：ActionChains与JavaScript执行

对于复杂的用户交互，如拖拽、悬停、组合键等，需要用到ActionChains。

from selenium.webdriver.common.action_chains import ActionChains from selenium.webdriver.common.keys import Keys actions = ActionChains(driver) # 鼠标悬停 menu = driver.find_element(By.ID, “navMenu”) actions.move_to_element(menu).perform() # 拖放操作 source = driver.find_element(By.ID, “draggable”) target = driver.find_element(By.ID, “droppable”) actions.drag_and_drop(source, target).perform() # 组合键操作（如在新标签页打开链接） link = driver.find_element(By.LINK_TEXT, “隐私政策”) actions.key_down(Keys.CONTROL).click(link).key_up(Keys.CONTROL).perform()

当Selenium的标准API无法满足需求时，我们可以直接执行JavaScript来操作DOM或浏览器。

# 滚动到页面底部 driver.execute_script(“window.scrollTo(0, document.body.scrollHeight);”) # 滚动到指定元素位置 element = driver.find_element(By.ID, “footer”) driver.execute_script(“arguments[0].scrollIntoView(true);”, element) # 修改元素属性（如隐藏一个弹窗） driver.execute_script(“document.getElementById(‘annoyingPopup’).style.display=‘none’;”) # 获取页面标题（示例） title = driver.execute_script(“return document.title;”)

实操心得：execute_script是一把瑞士军刀，可以解决很多棘手问题，比如处理原生JS弹窗 (alert,confirm,prompt)、给文件输入框 (<input type=“file”>) 直接赋值文件路径（绕过系统文件选择框）。但应谨慎使用，因为它绕过了正常的用户交互流程，可能掩盖了真实的交互问题。

4.3 浏览器导航、窗口与弹窗处理

导航：

driver.get(“https://www.example.com”) # 打开URL driver.back() # 后退 driver.forward() # 前进 driver.refresh() # 刷新

窗口与标签页：

main_window = driver.current_window_handle # 获取当前窗口句柄 all_windows = driver.window_handles # 获取所有窗口句柄 # 点击一个打开新标签页的链接后 driver.switch_to.window(all_windows[-1]) # 切换到最新打开的窗口 # ... 在新窗口操作 ... driver.close() # 关闭当前标签页 driver.switch_to.window(main_window) # 切回主窗口

弹窗与Alert处理：

from selenium.webdriver.common.alert import Alert # 等待并切换到Alert WebDriverWait(driver, 5).until(EC.alert_is_present()) alert = driver.switch_to.alert print(alert.text) # 获取警告文本 alert.accept() # 点击“确定” # alert.dismiss() # 点击“取消” # alert.send_keys(“text”) # 向Prompt输入文本

5. 框架设计与最佳实践

当测试用例从几个变成几十个、上百个时，没有良好的框架设计，代码会迅速变得难以维护。好的实践能让你的自动化项目具有长久的生命力。

5.1 Page Object Model (POM) 设计模式

这是UI自动化测试中最重要的设计模式。其核心思想是将页面封装成对象，页面的元素定位和操作细节封装在页面类中，测试用例只调用页面对象提供的方法，不关心具体实现。

一个简单的登录页面对象示例：

# pages/login_page.py from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC class LoginPage: def __init__(self, driver): self.driver = driver self.wait = WebDriverWait(driver, 10) # 定位器 (Locators) USERNAME_INPUT = (By.ID, “username”) PASSWORD_INPUT = (By.ID, “password”) LOGIN_BUTTON = (By.CSS_SELECTOR, “button[type=‘submit’]”) ERROR_MESSAGE = (By.CLASS_NAME, “alert-error”) # 页面操作方法 def enter_username(self, username): user_elem = self.wait.until(EC.visibility_of_element_located(self.USERNAME_INPUT)) user_elem.clear() user_elem.send_keys(username) return self # 支持链式调用 def enter_password(self, password): self.wait.until(EC.visibility_of_element_located(self.PASSWORD_INPUT)).send_keys(password) return self def click_login(self): self.wait.until(EC.element_to_be_clickable(self.LOGIN_BUTTON)).click() def get_error_message(self): try: return self.wait.until(EC.visibility_of_element_located(self.ERROR_MESSAGE)).text except: return None # 一个完整的业务场景方法 def login(self, username, password): self.enter_username(username) self.enter_password(password) self.click_login() # 可以返回下一个页面的对象，例如 HomePage

对应的测试用例：

# tests/test_login.py import pytest from pages.login_page import LoginPage def test_valid_login(driver): # 假设driver通过fixture注入 login_page = LoginPage(driver) login_page.login(“valid_user”, “valid_pass”) # 断言：验证登录成功，例如跳转到首页，URL变化或出现欢迎信息 assert “dashboard” in driver.current_url def test_invalid_login(driver): login_page = LoginPage(driver) login_page.login(“wrong_user”, “wrong_pass”) error_msg = login_page.get_error_message() assert error_msg is not None assert “用户名或密码错误” in error_msg

POM的优势：

高可维护性：当页面UI变化时（如ID改变），你只需要在一个地方（页面类）修改定位器，所有测试用例无需改动。
高可读性：测试用例读起来像自然语言，清晰表达了“做什么”（业务逻辑），而不是“怎么做”（技术细节）。
低冗余：避免了在多个测试用例中重复编写相同的定位和操作代码。

5.2 数据驱动测试

将测试数据（如用户名、密码组合）与测试逻辑分离，使得一套脚本可以轻松运行多组数据。这通常通过参数化测试来实现。

使用pytest的参数化装饰器：

import pytest # 测试数据可以来自列表、字典或外部文件（如JSON, CSV, Excel） test_login_data = [ (“admin”, “admin123”, True, “登录成功”), (“”, “admin123”, False, “用户名不能为空”), (“admin”, “”, False, “密码不能为空”), (“wrong”, “wrong”, False, “认证失败”), ] @pytest.mark.parametrize(“username, password, expected_success, expected_msg”, test_login_data) def test_login_with_data(driver, username, password, expected_success, expected_msg): login_page = LoginPage(driver) login_page.login(username, password) if expected_success: # 验证成功场景 assert “welcome” in driver.current_url else: # 验证失败场景 actual_msg = login_page.get_error_message() assert actual_msg is not None assert expected_msg in actual_msg

5.3 测试报告与日志

清晰的报告和日志是定位问题的关键。pytest本身可以生成简洁的报告，但结合pytest-html或Allure可以生成更美观、信息更丰富的HTML报告。

生成HTML报告：

安装：pip install pytest-html
运行：pytest --html=report.html --self-contained-html
报告会包含测试通过/失败状态、执行时间、错误追溯等信息。

在代码中添加日志：

import logging logging.basicConfig(level=logging.INFO, format=‘%(asctime)s - %(name)s - %(levelname)s - %(message)s’) logger = logging.getLogger(__name__) def click_element(self, locator): try: element = self.wait.until(EC.element_to_be_clickable(locator)) element.click() logger.info(f“成功点击元素: {locator}”) except TimeoutException: logger.error(f“等待元素可点击超时: {locator}”) # 可以在这里截图，辅助排查 self.driver.save_screenshot(“timeout_error.png”) raise

6. 高级技巧与疑难杂症破解

掌握了基础，我们来看看那些让新手头疼的“坑”和高级应用场景。

6.1 处理复杂等待与动态内容

现代前端应用大量使用Ajax和前端框架，元素状态变化异步且频繁。

等待元素消失：等待一个加载动画（spinner）消失。

WebDriverWait(driver, 15).until( EC.invisibility_of_element_located((By.ID, “loadingSpinner”)) )

等待多个元素：等待一个列表加载完成。

WebDriverWait(driver, 10).until( EC.presence_of_all_elements_located((By.CSS_SELECTOR, “.product-item”)) )

自定义等待条件：内置条件不满足时，可以自定义。

def element_has_text(locator, text): def predicate(driver): element = driver.find_element(*locator) return text in element.text return predicate # 等待某个元素包含特定文本 WebDriverWait(driver, 10).until( element_has_text((By.ID, “status”), “处理完成”) )

6.2 文件上传与下载

文件上传：对于<input type=“file”>，最可靠的方法是直接send_keys文件路径。
```
upload_input = driver.find_element(By.CSS_SELECTOR, “input[type=‘file’]”) upload_input.send_keys(“/Users/me/Desktop/test_image.jpg”) # 绝对路径
```
注意：不要尝试用ActionChains或click()去触发系统文件选择框，那会非常复杂且不稳定。直接给input元素赋值路径是标准做法。

文件下载：需要配置浏览器选项，指定下载目录并禁用下载弹窗。

chrome_options = Options() prefs = { “download.default_directory”: “/path/to/download/folder”, # 设置下载路径 “download.prompt_for_download”: False, # 禁用下载确认弹窗 “download.directory_upgrade”: True, “safebrowsing.enabled”: True } chrome_options.add_experimental_option(“prefs”, prefs)

下载后，你需要用Python的os或time模块去检查目标文件夹，确认文件是否已下载完成（通过检查文件是否存在且最近被修改）。

6.3 绕过反爬与检测机制

一些网站会检测Selenium的自动化特征，例如navigator.webdriver属性。这可能导致访问被拒绝。

基础隐身：添加一些参数可以消除部分特征。

chrome_options.add_argument(“--disable-blink-features=AutomationControlled”) chrome_options.add_experimental_option(“excludeSwitches”, [“enable-automation”]) chrome_options.add_experimental_option(‘useAutomationExtension’, False)

执行CDP命令：更彻底地覆盖JavaScript暴露的属性。

driver.execute_cdp_cmd(“Page.addScriptToEvaluateOnNewDocument”, { “source”: “”” Object.defineProperty(navigator, ‘webdriver’, { get: () => undefined }); “”” })

使用Undetected ChromeDriver：如果上述方法无效，可以考虑使用undetected-chromedriver这个第三方库，它专门用于绕过检测。但请注意，这应仅用于合法合规的自动化测试目的。

6.4 截图与录屏

截图是记录错误最直观的方式。

全屏截图：driver.save_screenshot(“error.png”)

元素截图：先定位元素，再调用其截图方法。

element = driver.find_element(By.ID, “chart”) element.screenshot(“chart_element.png”)

录屏：Selenium本身不提供录屏功能。可以通过集成其他工具实现，如在Linux下使用ffmpeg录制X11会话，或者使用专门的测试报告工具（如Allure）的附件功能。

7. 持续集成与实战部署

自动化测试的价值在于持续运行，及时反馈。将其集成到CI/CD流水线中是必经之路。

7.1 在CI环境中运行（以GitHub Actions为例）

在无界面的服务器或容器中运行，必须使用无头模式，并妥善处理依赖。

# .github/workflows/automated-tests.yml name: UI Automation Tests on: [push, pull_request] jobs: test: runs-on: ubuntu-latest steps: - uses: actions/checkout@v3 - name: Set up Python uses: actions/setup-python@v4 with: python-version: ‘3.10’ - name: Install system dependencies (for Chrome) run: | sudo apt-get update sudo apt-get install -y wget unzip libnss3 libgconf-2-4 libxss1 libappindicator1 libindicator7 fonts-liberation xvfb - name: Install Python dependencies run: | pip install -r requirements.txt # 包含selenium, pytest, webdriver-manager等 - name: Run UI Tests with Headless Chrome run: | # 使用xvfb-run创建一个虚拟显示环境来运行测试 xvfb-run --auto-servernum --server-args=“-screen 0 1920x1080x24” pytest tests/ -v --html=report.html --self-contained-html - name: Upload Test Report uses: actions/upload-artifact@v3 if: always() # 即使测试失败也上传报告 with: name: ui-test-report path: report.html

7.2 测试用例的组织与标记

使用pytest的标记（mark）功能来分类和管理用例。

# conftest.py 或测试文件中 import pytest @pytest.mark.smoke # 冒烟测试标记 def test_homepage_loads(driver): driver.get(“https://example.com”) assert “Example” in driver.title @pytest.mark.regression # 回归测试标记 @pytest.mark.slow # 慢速测试标记 def test_complete_checkout_flow(driver): # ... 一个很长的下单流程测试 pass

然后可以指定运行特定标记的测试：

pytest -m smoke # 只运行冒烟测试 pytest -m “not slow” # 不运行标记为slow的测试 pytest -m “regression and not slow” # 运行回归测试中非慢速的

7.3 性能考量与稳定性提升

并行测试：使用pytest-xdist插件可以并行运行测试，大幅缩短总执行时间。pytest -n 4表示使用4个worker并行。
驱动与浏览器复用：对于多个测试，不要每个测试都启动/关闭一次浏览器。可以使用pytest的scope=“session”级别的fixture来创建一次驱动，供所有测试使用，测试间只清理Cookies或LocalStorage。
```
# conftest.py import pytest @pytest.fixture(scope=“session”) def driver(): # 初始化驱动 d = webdriver.Chrome(options=...) yield d # 所有测试结束后关闭 d.quit()
```
稳定性三要素：稳定的定位器、合理的等待、及时的异常处理。这是编写稳定UI自动化脚本的不二法门。永远不要使用time.sleep()进行固定休眠，务必使用显式等待。

8. 常见问题排查与调试技巧

即使经验丰富，也会遇到脚本突然失败的情况。一套高效的排查流程至关重要。

8.1 问题排查清单

当测试失败时，按以下顺序排查：

浏览器/驱动版本匹配吗？：这是最常见的问题。检查Chrome和ChromeDriver版本。
元素定位器失效了吗？：页面UI是否已更新？用浏览器开发者工具手动验证你的定位器（在Console中用document.querySelector(‘你的CSS选择器’)或$x(‘你的XPath’)测试）。
等待时间足够吗？：网络慢或前端渲染慢可能导致元素加载超时。尝试增加显式等待的超时时间，或检查等待条件是否准确（例如，你是等待元素“可见”还是仅仅“存在”？）。

页面有iframe吗？：如果元素在<iframe>内，你必须先切换到对应的iframe才能操作其中的元素。

driver.switch_to.frame(“iframe_name_or_id”) # 通过name/id切换 # 或 driver.switch_to.frame(driver.find_element(By.TAG_NAME, “iframe”)) # 通过元素切换 # 操作iframe内元素... driver.switch_to.default_content() # 切回主文档

有新窗口/弹窗出现吗？：操作后是否打开了新窗口或弹窗，导致后续查找元素的对象上下文错误？检查driver.window_handles并适时切换。
脚本执行太快了吗？：在某些动画或异步操作未完成时就进行了下一步操作。在关键操作后添加一个短暂的、基于条件的等待（如等待某个元素状态变化），而不是盲目sleep。
环境问题？：检查CI环境或服务器上的Chrome是否正常运行，是否有足够的内存和磁盘空间。

8.2 强大的调试工具

保存页面源代码和截图：在失败时自动保存，是事后分析的黄金资料。

def test_something(driver): try: # ... 测试步骤 assert something except Exception as e: # 保存当前页面HTML with open(“page_source.html”, “w”, encoding=“utf-8”) as f: f.write(driver.page_source) # 保存截图 driver.save_screenshot(“failure.png”) # 保存浏览器日志（如果启用） print(driver.get_log(“browser”)) raise # 重新抛出异常，让测试框架知道失败了

使用pdb或IDE调试器：在关键步骤前设置断点，单步执行，观察变量和页面状态，这是定位复杂逻辑错误的最有效方法。
启用浏览器日志：初始化驱动时添加chrome_options.add_experimental_option(‘excludeSwitches’, [‘enable-logging’])可以禁用一些噪音，但如果你需要看网络或性能日志，可以通过CDP命令获取。

8.3 典型错误与解决方案速查表

错误信息	可能原因	解决方案
`NoSuchElementException`	1. 定位器错误或元素不存在。 2. 元素在iframe内。 3. 元素尚未加载出来。	1. 用开发者工具验证定位器。 2. 切换到正确的iframe。 3. 添加显式等待（`presence_of_element_located`或`visibility_of_element_located`）。
`ElementNotInteractableException`	1. 元素不可见（如被遮挡、`display:none`）。 2. 元素不可点击（如`disabled`）。 3. 另一个元素接收了点击（如透明覆盖层）。	1. 等待元素可见/可点击。 2. 检查元素属性。 3. 使用`ActionChains`或JS直接点击。 4. 滚动元素到视图内。
`TimeoutException`	显式等待超时。	1. 增加等待时间。 2. 检查等待条件是否正确。 3. 检查页面是否卡死或JS报错。
`StaleElementReferenceException`	之前找到的元素已从DOM中移除（页面刷新或重绘）。	重新查找元素。不要缓存可能变化的元素，或在操作前用try-catch包裹并重新定位。
`InvalidSelectorException`	XPath或CSS选择器语法错误。	检查定位器字符串，特别是引号、括号是否匹配。
`WebDriverException: unknown error: cannot determine loading status`	页面加载状态异常，可能是在一个非HTTP/HTTPS页面（如`about:blank`）。	在`driver.get()`后添加一个等待，确保页面加载完成。或检查初始化的URL。
`Session not created: This version of ChromeDriver only supports Chrome version X`	Chrome浏览器版本与ChromeDriver不匹配。	升级或降级ChromeDriver，使其与Chrome主版本号一致。推荐使用`webdriver-manager`。