当前位置：首页 > news >正文

Testing Weekly | 测试行业每周资讯-第 02 期 | 2026-04-27

news 2026/7/17 12:02:22

🤖 自动化测试 | Automation Testing

本周动态 | This Week’s Highlights

SmartBear 推出 BearQ— 全新 Agentic QA 系统，包含 Explorer/QA Lead/Tester 三类代理协作，实现端到端测试规划与执行。
OpenText AQM 26.1— 发布 off-cloud AI 能力，支持 BYOM（Bring Your Own Model），集成 Gemini 2.5 和 GPT-4.1，支持本地化部署。
智用开物（中国）完成近亿元天使+轮融资——工业 AI 智能体方向，质检与测试场景为核心落地环节，资本持续押注 AI+测试融合。
TestZeus Hercules登榜 GitHub QA-Automation 话题 — 全球首个开源全链路测试 Agent，支持 UI/API/Security/Accessibility/Visual，无需编码，4月23日更新。
测试行业调研数据（SmartBear，273家组织，2026年1月）：97% 的组织计划在 2026 年增加测试投入，AI 测试已成战略优先级。

新产品 / 新公司 | New Products & Startups

公司/产品	国家	方向	亮点	链接
BearQ(SmartBear)	美国	Agentic QA 系统	Explorer+QA Lead+Tester 三代理协作，全生命周期质量管理	smartbear.com
AQM 26.1(OpenText)	加拿大	质量中心 AI 增强	off-cloud AI + BYOM，Gemini 2.5/GPT-4.1，本地部署	opentext.com
智用开物	🇨🇳 中国	工业 AI 智能体	近亿元天使+轮，工业质检测试场景落地	36kr RSS
TestZeus Hercules	开源	开源测试 Agent	UI/API/Security/Accessibility/Visual 全覆盖，零代码	GitHub
Bug0 Passmark	开源	AI 浏览器回归测试	Playwright 库，智能缓存+自愈+多模型验证	GitHub

行业洞察 | Industry Insights

Agentic Testing 正式成为行业主赛道。SmartBear、OpenText、Tricentis、Autify、Momentic 五家主流厂商本周均有重磅 Agent 产品发布或更新，标志着测试行业从"AI 辅助工具"全面迈入"AI 自主测试代理"时代。值得关注的是，OpenAI 和 Anthropic 已推出 Foundation Model 级别的 Testing Agent 教程，对独立 SaaS 测试工具商构成直接竞争压力——大模型厂商正在"降维打击"测试工具赛道。

与此同时，GitHub 上开源测试 Agent 的崛起（TestZeus Hercules 等）将降低中小企业接入 AI 测试的门槛，对商业工具形成开源替代压力。

⚡ 性能测试 | Performance Testing

本周动态 | This Week’s Highlights

OpenText Performance Engineering + MCP— MCP 协议连接 AI 与实时性能工程系统，通过自然语言引导性能测试脚本生成。
HeteroFlow（中国）4月24日完成对华为昇腾等主流国产 GPU 的全面适配测试——国产算力生态测试验证加速。
LambdaTest HyperExecute— 实测数据：测试运行速度比传统云网格快70%，测试解析速度快2.5 倍，错误检测快60%。
DeepSeek V4 发布（4月24日）后，8家国产芯片 48 小时内完成适配，算力测试国产化进入冲刺阶段。
GitHub 活跃性能相关项目：Playwright（4月26日更新）、LocalStack（AWS 本地模拟）、Hoppscotch（API 测试，开源 Postman 替代）持续保持高热度。

新产品 / 新公司 | New Products & Startups

公司/产品	国家	方向	亮点	链接
Performance Engineering + MCP(OpenText)	加拿大	AI 性能测试	MCP 协议连接 AI 与性能系统，自然语言生成测试脚本	opentext.com
HeteroFlow	🇨🇳 中国	异构算力测试	完成昇腾等国产 GPU 全面适配测试	OSChina
HyperExecute(LambdaTest)	美国	云端性能测试	比传统云网格快 70%，测试解析快 2.5 倍	lambdatest.com
VTJ.PRO v2.3.8	🇨🇳 中国	低代码测试平台	新增 DeepSeek V4 支持，API 管理支持代理跨域	OSChina

行业洞察 | Industry Insights

MCP（Model Context Protocol）正在成为性能测试 AI 化的新基础设施。OpenText 将 MCP 协议引入性能测试工程，使得大模型可以直接连接到实时性能监控与测试系统，这一架构思路值得国内厂商跟进。性能测试过去依赖专业工具（JMeter/Gatling/k6）和资深工程师，MCP+AI 的组合有望大幅降低技术门槛。

国产 GPU 适配测试需求激增：DeepSeek V4 引发算力生态连锁反应，昇腾等国产芯片的适配测试工作量巨大，专门的算力测试服务商或将迎来增长机会。

🔒 安全测试 | Security Testing

本周动态 | This Week’s Highlights

🚨 LiteLLM 供应链攻击事件（4月21日）— Python 包 LiteLLM（月下载量 9700 万）被植入恶意代码，攻击者可窃取云凭证与私钥，恶意版本已上传 PyPI 官方仓库，所有用户需立即核查依赖。
Black Duck Polaris（Synopsys）连续第 8 年入选 Gartner Magic Quadrant Leader——统一 SAST+SCA+DAST+IaC，AI 驱动的 Black Duck Assist 提供 IDE 内修复建议。
OpenAI 安全漏洞事件— OpenAI 自动审核系统曾标记枪击案嫌疑人账户但未向执法部门通报，CEO 奥特曼公开道歉，AI 安全流程漏洞引发行业反思。
Anthropic Claude 账户风险事件— Anthropic 暂停 60+ Belo 账户，暴露单一 AI 工作空间的安全依赖风险。
Booking.com 诈骗（持续发酵）— 利用真实预订数据实施钓鱼，安全测试中社会工程学攻击防御成焦点。

新产品 / 新公司 | New Products & Startups

公司/产品	国家	方向	亮点	链接
Black Duck Polaris(Synopsys)	美国	SAST+SCA+DAST+IaC	Gartner MQ Leader 8连冠，Black Duck Assist AI 修复建议	synopsys.com
LiteLLM(安全事件)	开源	LLM 代理库	⚠️ 供应链攻击，9700万月下载，需立即核查	pypi.org
Booking.com 安全事件	荷兰	旅游安全测试	社工攻击案例分析	ijiandao.com

行业洞察 | Industry Insights

供应链安全测试已成企业刚需。LiteLLM 事件是 2026 年迄今为止最严重的开源供应链攻击之一，影响范围极广。这一事件再次证明：SAST+SCA（软件成分分析）的组合不是可选项，而是必需品。Synopsys Black Duck Polaris 连续 8 年 Leader 的背后，是企业对供应链安全日益增长的需求。

AI 安全测试成为新维度：OpenAI 自身的安全流程漏洞（未及时上报执法）表明，即便是最前沿的 AI 公司，其安全测试流程也存在盲区。AI 系统本身的安全性测试（而非仅用 AI 做安全测试）将成为下一个细分赛道。

🧠 AI测试 | AI-Driven Testing

本周动态 | This Week’s Highlights

DeepSeek V4 发布（4月24日）— 混合专家架构，V4-Pro（1.6万亿参数，激活490亿）和 V4-Flash（2840亿参数，激活130亿），支持 100 万 Token 上下文，同步开源，8家国产芯片 48 小时内完成适配。
微软 AI Evaluation Stack— LLM-as-Judge 双层架构（确定性层+语义层），Golden Dataset 为核心基准。
Tricentis Agentic Quality Engineering Platform— AI Workspace + Agentic Test Creation + Agentic Test Automation + Agentic Performance Testing。
豆包数据泄露事件（4月24日）— AI 爬取了未正式发布的山东事业编成绩查询链接，测试端口被 AI 提前抓取，暴露 AI 系统灰度测试管理盲区。
小米大模型语音能力— MiMo-V2.5-TTS/ASR 全链路语音模型发布，面向 Agent 时代语音交互测试需求。

新产品 / 新公司 | New Products & Startups

公司/产品	国家	方向	亮点	链接
DeepSeek V4	🇨🇳 中国	大语言模型	百万 Token 上下文，混合专家，国产芯片全面适配	deepseek.com
KaneAI(LambdaTest)	美国	AI Native QA Agent	手动脚本生成减少 40-70%，测试执行速度 +70%	lambdatest.com
Zenes(Autify)	日本	AI QA Agent	AI驱动的软件QA自动化	autify.com
Momentic	美国	AI 测试自动化	Series A $15M，用户描述流程→AI生成测试，2.6k+用户	techcrunch.com
AI Evaluation Stack(Microsoft)	美国	LLM 评测框架	双层架构（确定性+语义），Golden Dataset 基准	microsoft.com
Claude Design(Anthropic)	美国	AI 视觉素材生成	公测版，AI 生成设计稿	anthropic.com

行业洞察 | Industry Insights

LLM 评测正在成为独立学科。微软 AI Evaluation Stack 的双层架构（确定性层验证客观指标，语义层验证主观质量）揭示了一个核心矛盾：AI 生成代码越来越多，但测试 AI 生成内容的能力严重滞后。SmartBear 调研数据印证了这一点——70% 的组织担忧 AI 生成的代码质量，60% 已经遭遇过 AI 质量问题。

Golden Dataset 是 AI 测试的基础设施。无论是 LLM 评测还是 AI 辅助测试用例生成，可信、可复现的基准数据集成为行业刚需。这对于测试工程师而言是一个新方向：数据标注+评测数据集构建，可能成为新的职业增长点。

💼 测试就业市场 | Testing Job Market

招聘趋势 | Recruitment Trends

技能方向	热度变化	典型要求	薪资参考
AI 测试 / LLM 评测	⬆️⬆️ 强势上升	大模型测试 + 提示词工程 + Golden Dataset 构建	35k-70k CNY（含AI溢价）
Agentic Testing	⬆️⬆️ 快速上升	AI驱动的测试自动化 + MCP协议理解	30k-60k CNY
性能测试（国产算力）	⬆️ 稳定上升	GPU适配测试 + JMeter/Gatling/k6 + 全链路压测	25k-50k CNY
安全测试 / SAST	⬆️ 稳定上升	渗透测试 + SCA供应链安全 + DAST	28k-55k CNY
传统手工测试	➡️ 持平/下降	基础功能测试，AI替代压力增大	12k-22k CNY
半导体测试工程师	⬆️ 明显上升	芯片测试设备 + ATE + 良率分析	30k-60k CNY（矽电股份等需求旺盛）

就业形势分析 | Employment Analysis

供需结构分化加剧。从本周数据看，AI/大模型测试工程师需求旺盛，具备 LLM 评测、AI Agent 测试能力的工程师薪资溢价明显（部分岗位突破 70k CNY）。与此同时，传统手工测试岗位竞争加剧，企业普遍通过 AI 工具提效，岗位增量有限。

半导体测试成新增长点。矽电股份本周签署 3.35 亿元半导体测试设备合同，摩尔线程 Q1 营收同比 +155%，算力扩张带动芯片测试工程师需求。

国际信号：耐克本周裁员 1400 人（影响技术/运营岗位），全球消费品/零售行业技术岗收缩趋势延续，测试岗位不能只看互联网行业，半导体、金融科技、智能制造等方向值得关注。

关键人才缺口：97% 的组织计划增加测试投入，但 65% 的技术领导者对 AI 代码质量风险缺乏清晰认知——具备 AI 质量保障能力的测试工程师严重供不应求。

💡 技能建议 | Skill Recommendations

LLM 评测能力— 学习使用 Golden Dataset 构建基准、LLM-as-Judge 方法论，理解确定性指标与语义指标的区别
Agentic Testing 工具链— 掌握 Playwright + MCP 协议集成，TestZeus Hercules 等开源 Agent 框架
供应链安全测试— 学习 SCA 工具（Black Duck、Dependabot），理解 SBOM 生成与管理
国产算力测试— 昇腾/DeepSeek 生态的测试适配能力，GPU 性能测试方法

💡 创业机会 | Startup Opportunities

方向一：AI Test Data Marketplace（AI测试数据市场）

市场痛点：Golden Dataset 是 AI 测试的基础设施，但构建成本高、复用率低。SmartBear 数据显示 65% 的技术领导者不理解 AI 质量风险，根本原因是缺乏可信赖的评测基准数据。
可行性：高需求 + 低供给，适合 SaaS 平台模式。参考 Scale AI 的数据标注商业模式，可垂直切入"AI模型测试数据集"细分赛道。
建议切入方式：先聚焦单一垂类（金融 AI 测试数据集 / 医疗 AI 测试数据集），建立数据采集-标注-评测-反馈闭环。

方向二：Test Agent Infrastructure（测试 Agent 基础设施层）

市场痛点：大模型厂商（OpenAI、Anthropic）正在推出通用 Testing Agent，但企业级测试场景复杂（ERP、游戏、金融系统），通用 Agent 无法满足深度需求。
可行性：开源框架（TestZeus Hercules）验证了需求，但企业级特性（权限管理、审计日志、合规报告）仍是空白。
建议切入方式：基于开源框架做企业级封装，提供私有部署版本 + 行业模板库，差异化定位在"复杂场景适配"。

方向三：供应链安全测试即服务（SecSaaS for Supply Chain）

市场痛点：LiteLLM 事件证明，即便是有经验的工程团队也难以实时监控供应链安全，依赖手动排查不可持续。
可行性：与 Black Duck 等大型工具互补——大型工具面向大型企业，中小企业对轻量级、低成本供应链安全检测需求未被满足。
建议切入方式：提供 GitHub/CI 集成的轻量级 SCA 扫描服务，按扫描次数或代码行数计费，快速PMF验证。

📚 本周优质文章 | Top Articles This Week

标题	来源	语言	一句话点评
SmartBear BearQ Agentic QA System	SmartBear	EN	三代理协作开启 Agentic QA 新范式，测试规划进入自主时代
DeepSeek V4 发布：混合专家架构百万上下文	DeepSeek	CN	国产大模型最高水位，算力生态测试适配竞争白热化
Synopsys Black Duck Polaris - Gartner MQ 8连冠	Synopsys	EN	供应链安全测试已成企业合规刚需，市场高度集中
LiteLLM Supply Chain Attack Analysis	爱尖刀	CN	9700万月下载包的供应链攻击，SAST+SCA组合必要性再验证
LambdaTest KaneAI - AI Native QA Agent	LambdaTest	EN	脚本生成减少40-70%，AI测试ROI首次量化
TestZeus Hercules - Open Source Test Agent	GitHub	EN	开源测试Agent里程碑，零代码全链路测试覆盖
Microsoft AI Evaluation Stack - LLM-as-Judge	Microsoft	EN	LLM评测方法论双层架构，Golden Dataset成为行业共识
豆包数据泄露事件分析	36kr	CN	AI灰度测试管理盲区，AI系统自身安全性测试成新议题
智用开物近亿元融资：工业AI智能体	36kr	CN	测试质检场景成工业AI落地锚点，资本持续押注AI+测试