当前位置：首页 > news >正文

基于pytest+uiautomation+Allure的Windows桌面应用自动化测试框架搭建指南

news 2026/7/2 23:59:39

1. 项目概述与核心价值

最近在帮团队重构一个老旧的桌面应用自动化测试项目，原来的脚本维护起来简直是灾难——硬编码的测试数据、散落在各处的UI操作、还有那永远也看不懂的测试报告。痛定思痛，我决定用pytest+uiautomation+allure这套组合拳，再配上YAML做数据驱动，彻底重构一遍。折腾了小半个月，踩了不少坑，也总结出了一套行之有效的搭建方案。今天就把这个“yaml版本”的桌面自动化项目搭建指南分享出来，无论你是想从零开始搭建，还是想优化现有的混乱脚本，相信都能找到直接的参考。

这套方案的核心价值在于“清晰”和“高效”。pytest提供了灵活且强大的测试组织和执行能力；uiautomation作为微软官方的 UI 自动化库，对 Windows 桌面应用（包括 Win32、WPF、UWP 甚至控制台）的支持非常原生和稳定；allure则能生成极其美观、信息丰富的测试报告，让问题定位一目了然。而YAML数据驱动，则是将测试数据与测试逻辑彻底解耦的利器，让维护测试用例变得像编辑文档一样简单。最终，我们得到的是一个结构清晰、易于维护、报告漂亮且能稳定运行的桌面自动化测试项目。

2. 技术栈选型与深度解析

为什么是这“三件套”加上YAML？这背后是经过实际项目验证的深度考量，绝非简单的技术堆砌。

2.1 为什么选择 pytest 而非 unittest？

pytest不仅仅是unittest的替代品，它在自动化测试领域几乎成了事实上的标准。首先，它的断言语法极其人性化，直接用assert语句，写起来就像写普通 Python 代码一样自然，出错信息也更清晰。其次，pytest的夹具（fixture）系统是革命性的，它提供了模块化、可重用的测试准备和清理机制，远超unittest的setUp/tearDown。对于桌面自动化，我们可以轻松创建如启动应用、初始化驱动、登录等夹具，并在多个测试用例中共享。

更重要的是，pytest的插件生态无比丰富。pytest-html可以生成基础报告，pytest-xdist支持分布式测试（虽然桌面自动化并行需谨慎），而与我们项目强相关的pytest-allure-adaptor或allure-pytest插件，能无缝地将测试结果输出为allure可识别的数据格式。此外，pytest对参数化测试（@pytest.mark.parametrize）的支持是原生且强大的，这为我们后续实现基于 YAML 的数据驱动奠定了完美的基础。它的命令行接口也非常强大，可以灵活地选择运行哪些测试、如何运行。

2.2 uiautomation 的优势与适用场景

在 Windows 桌面自动化领域，可选方案不少，比如pywinauto、pyautogui、SikuliX等。我最终选择uiautomation（这里特指uiautomation这个Python库，由yinkaisheng开发，封装了微软的UI AutomationAPI），主要基于以下几点：

原生与稳定：它直接调用 Windows 底层的UI Automation接口，这是微软为辅助技术和自动化测试提供的官方框架。这意味着它对各种 Windows 应用（Win32、WPF、UWP、Qt等）的控件识别和支持是最底层、最稳定的，兼容性问题最少。
控件识别能力强：可以获取到丰富的控件属性，如ClassName、Name、AutomationId、ControlType等。特别是AutomationId，对于现代 WPF/UWP 应用来说，是定位控件最可靠的方式。它同样支持图像识别作为辅助定位手段。
性能相对较好：由于是原生接口调用，相比一些基于图像识别的方案，执行速度更快，更节省资源。
功能全面：支持鼠标、键盘操作，支持获取和设置控件属性（文本、状态等），支持监听控件事件。

当然，它也有学习曲线，需要了解 Windows UI 自动化树的结构和控件的各种属性。但对于需要长期维护、追求稳定性的企业级桌面自动化项目，uiautomation是更可靠的选择。pywinauto也是一个优秀的库，它底层也使用UI Automation（或更老的Win32 API），并提供了更“Pythonic”和友好的 API。两者的选择有时取决于个人或团队的偏好以及具体应用的类型。在本指南中，我们以uiautomation为例，但其设计模式完全适用于pywinauto。

2.3 Allure 报告：不仅仅是好看

allure报告的魅力，用过一次就回不去了。它远不止是一个漂亮的 HTML 页面。首先，它提供了清晰的测试套件、用例分层视图，这对于我们按模块组织的大量自动化用例至关重要。其次，它支持丰富的附件功能，我们可以轻松地将测试失败时的截图、操作日志、甚至是出错的控件信息快照附加到报告中，这为失败分析提供了无可比拟的便利。

与pytest的集成非常顺畅。通过简单的装饰器@allure.title、@allure.description、@allure.step，我们可以为测试用例和操作步骤添加详细的描述，使得报告可读性极高，非技术人员也能看懂测试在做什么、哪一步出了问题。allure还支持历史趋势分析、环境信息记录等，是打造专业自动化测试体系不可或缺的一环。

2.4 YAML：数据驱动的优雅载体

数据驱动测试的核心思想是将测试数据从测试脚本中分离出来。YAML（YAML Ain‘t Markup Language）因其简洁、易读、易写的特性，成为存储测试数据的绝佳选择。相比于 JSON，它不需要那么多括号和引号，支持注释，结构通过缩进表示，看起来就像一份结构化的文档。相比于 Excel/CSV，它更易于版本控制工具（如 Git）进行差异比较和合并。

在我们的项目中，一个典型的测试用例数据用 YAML 表示可能是这样的：

test_cases: - case_id: TC_LOGIN_001 name: "管理员账号正常登录" data: username: "admin" password: "correct_password" expected: "login_success" steps: - action: input_username locator: {id: "usernameBox"} value: "{username}" - action: input_password locator: {id: "passwordBox"} value: "{password}" - action: click_login locator: {name: "登录"} validation: - element: {id: "welcomeText"} expected_text: "欢迎，admin"

这种结构一目了然，测试人员甚至产品经理都可以直接参与测试数据的维护和设计，极大地提升了协作效率。

3. 项目目录结构设计与思想

一个清晰的项目结构是可持续维护的基石。下面是我推荐的目录结构，并解释每个部分的作用：

desktop_auto_project_yaml/ ├── config/ # 配置文件目录 │ ├── __init__.py │ ├── settings.yaml # 全局配置，如应用路径、超时时间、截图路径等 │ └── elements.yaml # 页面元素定位信息（可选，另一种PO模式） ├── data/ # 测试数据目录 │ ├── __init__.py │ ├── login_data.yaml # 登录模块测试数据 │ ├── order_data.yaml # 订单模块测试数据 │ └── ... # 其他模块数据 ├── test_cases/ # 测试用例目录 │ ├── __init__.py │ ├── conftest.py # pytest 共享夹具定义 │ ├── test_login.py # 登录测试模块 │ ├── test_order.py # 订单测试模块 │ └── ... # 其他测试模块 ├── page_objects/ # 页面对象模型目录 │ ├── __init__.py │ ├── base_page.py # 页面基类，封装通用操作 │ ├── login_page.py # 登录页面对象 │ ├── main_page.py # 主页面对象 │ └── ... # 其他页面对象 ├── utils/ # 工具函数目录 │ ├── __init__.py │ ├── driver_manager.py # uiautomation 驱动管理（单例/会话管理） │ ├── data_loader.py # YAML 数据加载与解析器 │ ├── allure_utils.py # 自定义 allure 附件、步骤工具 │ ├── screenshot.py # 截图工具 │ └── logger.py # 日志记录工具 ├── reports/ # 测试报告目录（.gitignore） │ ├── allure-results/ # allure 原始结果数据 │ └── allure-report/ # 生成的 HTML 报告 ├── logs/ # 日志文件目录（.gitignore） ├── requirements.txt # Python 依赖包列表 └── pytest.ini # pytest 配置文件

设计思想解析：

配置与数据分离：config/存放环境相关的静态配置，data/存放纯粹的测试输入和预期输出。修改环境或测试数据时，互不影响。
页面对象模型（PO）：page_objects/目录是核心。我们将每个UI窗口或页面抽象成一个类，页面的元素定位和基本操作（如输入、点击）封装在这个类的方法中。测试脚本（test_cases/）只调用页面对象的方法，不直接包含uiautomation的定位代码。这极大提高了代码的可维护性和复用性。
工具模块化：utils/下的工具类各司其职。驱动管理确保uiautomation实例的全局唯一和正确生命周期；数据加载器负责读取和解析 YAML；allure工具让添加步骤和附件更便捷。
pytest 配置：pytest.ini统一管理 pytest 的运行行为，如默认命令行参数、测试搜索路径、日志格式等。conftest.py定义项目级别的夹具，如驱动初始化夹具，供所有测试模块使用。
报告与日志独立：reports/和logs/目录被.gitignore忽略，避免将生成的动态文件提交到代码库。

4. 核心模块实现详解

接下来，我们深入几个核心模块的代码实现，这是项目的骨架。

4.1 驱动管理：uiautomation 的封装与生命周期控制

桌面自动化测试中，驱动的初始化、获取和销毁是关键。我们采用夹具来管理，确保每个测试会话或用例都有正确的初始状态。

首先，在utils/driver_manager.py中，我们创建一个稳健的驱动管理类：

# utils/driver_manager.py import uiautomation as auto from typing import Optional class UIAutomationDriver: _instance: Optional[auto.WindowControl] = None @classmethod def get_driver(cls, process_name: str = None, class_name: str = None, **kwargs) -> auto.WindowControl: """ 获取全局唯一的 uiautomation 顶层窗口驱动。 支持通过进程名或类名查找已启动的窗口。 """ if cls._instance is None: if process_name: # 通过进程名查找顶层窗口 cls._instance = auto.WindowControl(searchDepth=1, ClassName=class_name, **kwargs) # 更推荐使用 ProcessId 进行精确查找，但需要先获取进程ID # 这里简化处理，实际项目中可根据需要增强 cls._instance = auto.GetRootControl().GetFirstChildControl( lambda c: c.ProcessId == auto.GetProcessId(process_name) ) else: # 如果没有指定，可以返回一个根控件或者等待后续绑定 # 通常我们会在具体页面对象或夹具中绑定具体窗口 cls._instance = auto.WindowControl(searchDepth=1, **kwargs) return cls._instance @classmethod def quit_driver(cls): """清理驱动实例。注意：uiautomation 不需要像 selenium 那样 quit，这里主要是置空实例。""" # 可以在这里添加一些清理操作，比如关闭所有由自动化打开的子窗口 cls._instance = None @classmethod def restart_driver(cls, process_name: str = None, **kwargs) -> auto.WindowControl: """重启驱动，先退出再获取。用于需要全新会话的场景。""" cls.quit_driver() return cls.get_driver(process_name, **kwargs)

注意：uiautomation的控件对象本身不包含“启动应用”的概念。通常，我们需要先通过subprocess或其他方式启动被测应用进程，然后uiautomation再去查找对应的窗口。因此，驱动管理更侧重于对找到的顶层窗口控件的管理和复用。

接着，在test_cases/conftest.py中，我们定义 pytest 夹具来管理测试生命周期：

# test_cases/conftest.py import pytest import subprocess import time from utils.driver_manager import UIAutomationDriver from config.settings import APP_PATH, APP_PROCESS_NAME, WAIT_TIMEOUT @pytest.fixture(scope="session") def start_app(): """ 会话级夹具：启动被测应用程序。 在整个测试会话中只启动一次。 """ # 检查应用是否已运行，避免重复启动 # 这里需要根据实际情况实现检查逻辑，例如通过进程名判断 # 假设我们总是启动一个新的实例 process = subprocess.Popen(APP_PATH) # 等待应用启动完成 time.sleep(3) # 根据应用实际情况调整等待时间 yield process # 测试会话结束后，终止应用进程 process.terminate() process.wait() @pytest.fixture(scope="function") def ui_driver(start_app): """ 函数级夹具：获取并返回 uiautomation 驱动（顶层窗口）。 每个测试函数执行前都会尝试获取或绑定窗口。 """ # 等待应用窗口出现 window = auto.WindowControl(searchDepth=1, ClassName='YourAppMainWindowClass') # 替换为实际的类名 window.SetActive() # 激活窗口 yield window # 测试函数结束后，可以做一些清理，比如关闭可能弹出的对话框 # 但通常不需要销毁 window 对象本身 # 我们可以将驱动管理器实例置空，但夹具返回的 window 对象生命周期由 pytest 管理 # UIAutomationDriver.quit_driver() # 根据实际情况决定是否调用

4.2 数据加载器：YAML 文件的灵活读取与参数化

数据驱动的核心是如何将 YAML 中的数据优雅地注入到测试用例中。我们创建一个通用的数据加载工具。

# utils/data_loader.py import yaml import os from typing import Any, Dict, List import pytest class YamlDataLoader: def __init__(self, data_dir: str = "data"): self.data_dir = data_dir def load_yaml(self, file_name: str) -> Dict[str, Any]: """加载指定的 YAML 文件，返回字典数据。""" file_path = os.path.join(self.data_dir, file_name) with open(file_path, 'r', encoding='utf-8') as f: data = yaml.safe_load(f) return data or {} def get_test_cases(self, file_name: str, key: str = 'test_cases') -> List[Dict]: """ 从 YAML 文件中获取测试用例列表。 默认从 'test_cases' 键下获取。 """ data = self.load_yaml(file_name) return data.get(key, []) @staticmethod def generate_pytest_parametrize_args(test_cases: List[Dict]) -> list: """ 将测试用例数据转换为 @pytest.mark.parametrize 可用的参数格式。 返回一个列表，列表中的每个元素是一个元组，对应一组参数。 也可以返回一个列表的列表，用于 `argnames` 和 `argvalues`。 这里我们设计为返回 (用例ID, 用例数据) 的列表。 """ params = [] for case in test_cases: # 将整个用例字典作为参数，或者提取出需要的字段 case_id = case.get('case_id', 'unknown') # 我们可以将 case_id 和 case_data 一起传递 params.append(pytest.param(case, id=case_id)) return params # 全局实例，方便导入 data_loader = YamlDataLoader()

在测试用例中，我们可以这样使用：

# test_cases/test_login.py import pytest import allure from utils.data_loader import data_loader from page_objects.login_page import LoginPage # 从 YAML 文件加载测试用例数据 login_test_cases = data_loader.get_test_cases('login_data.yaml') class TestLogin: @pytest.mark.parametrize('test_case_data', data_loader.generate_pytest_parametrize_args(login_test_cases)) @allure.title('登录测试 - {test_case_data[name]}') # 动态设置 allure 报告标题 def test_login(self, ui_driver, test_case_data): """ 数据驱动的登录测试。 """ login_page = LoginPage(ui_driver) # 从数据中提取测试输入和预期结果 username = test_case_data['data']['username'] password = test_case_data['data']['password'] expected = test_case_data['data']['expected'] # 执行登录步骤 with allure.step(f"输入用户名: {username}"): login_page.input_username(username) with allure.step(f"输入密码: {password}"): login_page.input_password(password) with allure.step("点击登录按钮"): login_page.click_login_button() # 根据预期结果进行断言 if expected == 'login_success': with allure.step("验证登录成功"): assert login_page.is_login_success(), f"登录失败，未跳转到主页面" # 可以附加更多成功后的验证，比如检查用户名显示 elif expected == 'login_fail': with allure.step("验证登录失败提示"): error_msg = login_page.get_error_message() assert "密码错误" in error_msg or "用户不存在" in error_msg, f"未出现预期的错误提示，实际提示：{error_msg}" # 添加截图到报告 allure.attach(ui_driver.BitmapToFile(), name='登录后界面', attachment_type=allure.attachment_type.PNG)

4.3 页面对象模型：封装 uiautomation 操作

页面对象模型是降低脚本维护成本的关键。我们创建一个基类来封装公共方法，然后为每个页面创建子类。

# page_objects/base_page.py import uiautomation as auto import time from utils.logger import get_logger logger = get_logger(__name__) class BasePage: def __init__(self, driver: auto.WindowControl): """ :param driver: uiautomation 的顶层窗口控件对象。 """ self.driver = driver self.timeout = 10 # 默认查找控件超时时间 def find_element(self, locator: dict, timeout: int = None) -> auto.Control: """ 根据定位字典查找控件。 locator 格式示例: {'id': 'usernameBox'}, {'name': '登录'}, {'className': 'Edit', 'automationId': 'tbUser'} """ if timeout is None: timeout = self.timeout search_args = {} # 将 locator dict 转换为 uiautomation 的搜索条件 key_mapping = {'id': 'AutomationId', 'name': 'Name', 'className': 'ClassName', 'control_type': 'ControlType'} for key, value in locator.items(): if key in key_mapping: search_args[key_mapping[key]] = value else: search_args[key] = value # 支持其他原生属性 start_time = time.time() element = None while time.time() - start_time < timeout: element = self.driver.FindControl(**search_args) if element.Exists(): break time.sleep(0.5) if not element or not element.Exists(): logger.error(f"未找到元素: {locator}, 超时 {timeout} 秒") raise auto.ElementNotFoundError(f"Element not found with locator: {locator}") return element def click(self, locator: dict): """点击元素。""" element = self.find_element(locator) element.Click() def input_text(self, locator: dict, text: str): """向输入框输入文本。""" element = self.find_element(locator) element.Click() # 先点击获取焦点 element.SendKeys('{Ctrl}a') # 全选（可选，清空原有内容） element.SendKeys('{Delete}') # 删除 element.SendKeys(text) def get_text(self, locator: dict) -> str: """获取元素的文本内容。""" element = self.find_element(locator) return element.Name # 对于许多控件，Name属性就是显示的文本。也可能是 .LegacyIAccessibleObject.Value # 可以继续封装其他通用操作，如双击、右击、拖拽、获取属性等

然后，实现具体的登录页面对象：

# page_objects/login_page.py from page_objects.base_page import BasePage import allure class LoginPage(BasePage): # 元素定位器，集中管理。也可以放到 config/elements.yaml 中再读取。 USERNAME_INPUT = {'id': 'usernameBox', 'control_type': 'Edit'} PASSWORD_INPUT = {'id': 'passwordBox', 'control_type': 'Edit'} LOGIN_BUTTON = {'name': '登录', 'control_type': 'Button'} ERROR_MSG = {'id': 'errorLabel', 'control_type': 'Text'} @allure.step("输入用户名: {username}") def input_username(self, username: str): self.input_text(self.USERNAME_INPUT, username) @allure.step("输入密码: {password}") def input_password(self, password: str): self.input_text(self.PASSWORD_INPUT, password) @allure.step("点击登录按钮") def click_login_button(self): self.click(self.LOGIN_BUTTON) @allure.step("获取错误提示信息") def get_error_message(self) -> str: try: return self.get_text(self.ERROR_MSG) except Exception as e: logger.warning(f"获取错误信息失败: {e}") return "" @allure.step("检查是否登录成功") def is_login_success(self) -> bool: # 通过判断是否成功跳转到主页面，或者出现某个成功元素来判断 # 例如，查找主窗口的某个特定元素 from page_objects.main_page import MainPage # 避免循环导入 main_page = MainPage(self.driver) try: # 尝试查找主页面的一个标志性元素，设定一个较短的超时时间 main_page.find_element(MainPage.WELCOME_LABEL, timeout=3) return True except Exception: return False

5. 测试执行、报告生成与实战技巧

项目搭建好后，如何运行测试并生成漂亮的报告？这里涉及 pytest 配置和 allure 命令行工具的使用。

5.1 pytest.ini 配置与常用命令

创建pytest.ini文件来统一 pytest 的运行配置：

# pytest.ini [pytest] # 指定测试文件的位置和命名规则 testpaths = test_cases python_files = test_*.py python_classes = Test* python_functions = test_* # 添加命令行默认选项 addopts = -v # 详细输出 --tb=short # 发生错误时，打印简短的 traceback 信息 --strict-markers # 严格检查标记 --alluredir=./reports/allure-results # 指定 allure 结果输出目录 # 定义自定义标记，用于分类运行测试 markers = smoke: 冒烟测试用例 login: 登录模块测试 order: 订单模块测试 slow: 运行较慢的测试

常用命令示例：

运行所有测试：在项目根目录执行pytest。
运行特定模块：pytest test_cases/test_login.py
运行带有特定标记的测试：pytest -m smoke
运行包含特定字符串的测试：pytest -k "login"（运行名称中包含“login”的测试）
生成 allure 结果：上面的addopts已经配置了--alluredir，所以直接运行pytest就会在./reports/allure-results下生成结果文件。

5.2 Allure 报告的生成与美化

首先，确保已安装allure命令行工具和allure-pytest插件。

pip install allure-pytest # 需要单独安装 allure 命令行工具，可以从官网下载或通过包管理器（如 scoop、choco）安装

生成 HTML 报告分为两步：

运行测试，收集结果：pytest命令执行后，结果已生成在./reports/allure-results。
生成 HTML 报告：在项目根目录执行allure generate ./reports/allure-results -o ./reports/allure-report --clean。这个命令会读取结果文件，在./reports/allure-report目录下生成一个静态 HTML 报告。
打开报告：执行allure open ./reports/allure-report会在默认浏览器中打开报告。

美化与增强报告：

添加环境信息：在reports/allure-results目录下创建一个environment.properties文件，内容如：
```
OS=Windows 10 Python=3.9.0 Pytest=7.0.0 App Version=1.2.3
```
这样报告里会显示一个“环境”标签页。
使用步骤装饰器：如前文代码所示，大量使用@allure.step装饰操作函数，报告中的测试步骤会非常清晰。
动态附件：在测试用例中，使用allure.attach()附加截图、日志文件、数据文件等，对失败分析至关重要。

5.3 实战避坑技巧与经验分享

控件定位不稳定问题：
- 优先使用AutomationId：这是最稳定、唯一的标识符，需要开发同学在开发时给控件设置好。
- 组合定位：当单一属性不稳定时，可以组合使用多个属性，如{'className': 'Edit', 'automationId': 'tbUser', 'name': ''}。
- 使用searchDepth和foundIndex：uiautomation的FindControl支持searchDepth（搜索深度）和foundIndex（找到的第几个匹配项）来精确定位。
- 图像识别辅助：对于极难定位的控件（如游戏界面、自定义绘制控件），可以结合uiautomation的Bitmap相关方法进行图像识别，但应作为最后手段。
等待与同步策略：
- 隐式等待：像上面BasePage.find_element方法实现的，就是自定义的“显式等待”循环。uiautomation本身没有隐式等待概念。
- 显式等待特定条件：不要无脑用time.sleep。等待控件出现、等待控件属性变为特定值。可以封装一个wait_until函数。
- 应用响应等待：在关键操作（如点击一个会触发长时间计算的按钮）后，需要等待应用响应。可以等待某个进度条消失，或者某个结果控件出现。
处理弹窗和意外窗口：
- 在夹具的teardown阶段，或者每个测试用例的开始/结束，可以尝试查找并关闭可能意外出现的弹窗（如警告框、确认框）。
- 使用auto.GetForegroundControl()获取当前前景窗口，判断其是否为需要处理的意外窗口。
截图与日志：
- 失败自动截图：在conftest.py中利用 pytest 的钩子函数pytest_runtest_makereport，在测试失败时自动截取当前屏幕并附加到 allure 报告。
- 结构化日志：使用 Python 的logging模块，配置输出到文件和控制台。在关键操作前后记录日志，日志级别要合理（DEBUG 用于详细追踪，INFO 用于关键步骤，ERROR 用于失败）。
测试数据管理：
- YAML 文件中可以使用锚点（&）和引用（*）来复用公共数据。
- 考虑使用不同的 YAML 文件来区分测试环境（如test_data.yaml，prod_data.yaml），或者通过配置文件动态加载。
- 对于敏感信息（如密码），不要硬编码在 YAML 中。可以使用环境变量，或者在 YAML 中引用环境变量，由数据加载器在运行时替换。
并行测试的挑战：
- 桌面应用通常不是为多实例设计的，并行运行多个测试可能会相互干扰（如操作同一个全局配置文件、抢占同一界面）。
- 如果必须并行，考虑使用虚拟机、容器或独立的用户会话隔离每个测试执行环境。这通常比较复杂，在项目初期不建议采用。

这套pytest + uiautomation + allure + YAML的方案，经过多个实际项目的打磨，证明其能够有效支撑起中大型 Windows 桌面应用的自动化测试需求。它带来的最大好处是脚本可维护性的质的提升。当业务逻辑变更时，你通常只需要更新对应的页面对象方法；当测试用例需要增减或修改时，你只需要编辑 YAML 文件。而allure报告则让测试结果可视化，让团队沟通更加高效。

查看全文

http://www.jsqmd.com/news/1111972/