当前位置：首页 > news >正文

AI 辅助：刷题系统：如何把题解生成变成可验证流程

news 2026/7/2 2:22:24

AI 辅助：刷题系统：如何把题解生成变成可验证流程

一、题解能生成，不代表题解可信

AI 工具已经能快速生成算法题解。输入题目，几秒钟就能得到思路、代码和复杂度。问题是，题解看起来像对的，不一定真的对。边界条件漏掉、复杂度分析写错、代码只过样例不过隐藏测试，这些问题在自动生成内容里很常见。

刷题系统要想真正有用，不能停在“生成答案”。它必须把题解生成变成可验证流程。至少包含四个环节：题意结构化、算法候选生成、测试用例构造、代码执行验证。没有验证的题解，只是语气自信的草稿。

比较稳的目标是让 AI 做三件事：给出多种思路，补充容易漏的边界测试，解释错误代码为什么失败。最终通过与否，仍然要靠测试和复杂度约束决定。算法题最讲证据，不能靠模型说“应该可以”。

二、验证链路：从题目到可复跑结果

flowchart TD A[原始题目] --> B[提取输入输出与约束] B --> C[生成候选算法] C --> D[构造边界测试] C --> E[生成参考实现] D --> F[本地执行] E --> F F --> G{是否通过} G -- 是 --> H[输出题解与复杂度] G -- 否 --> I[记录失败用例并修正] I --> C

这条链路里，测试用例非常关键。很多错误解法能过样例，是因为样例太温柔。边界测试应该覆盖空数组、重复值、极端值、单元素、全相等、严格递增、严格递减、随机大数据。对图论题，还要覆盖不连通、自环、重边和环。

复杂度也要验证。模型可能写出 O(n²) 算法，却声称 O(n log n)。对于约束n = 1e5的题，O(n²) 基本不可接受。刷题系统要把约束转成复杂度门槛，再判断候选算法是否合理。

三、实现示例：用测试驱动题解生成

下面是一个简化的 Python 验证器。它不负责生成题解，只负责让题解接受测试。

from dataclasses import dataclass from typing import Callable, Any @dataclass class Case: name: str args: tuple expected: Any def run_cases(fn: Callable, cases: list[Case]) -> list[str]: failures: list[str] = [] for case in cases: try: actual = fn(*case.args) except Exception as exc: failures.append(f"{case.name}: raised {type(exc).__name__}: {exc}") continue if actual != case.expected: failures.append(f"{case.name}: expected={case.expected}, actual={actual}") return failures def assert_solution(fn: Callable, cases: list[Case]) -> None: failures = run_cases(fn, cases) if failures: raise AssertionError("\n".join(failures))

这段代码很普通，但它提供了题解可信度的底座。每次 AI 生成代码后，都必须把候选实现放进验证器跑。失败用例再反馈给模型，让模型修正。这样 AI 的角色是候选生成器，而不是最终裁判。

对于复杂题，还可以加入对拍。写一个暴力解作为 oracle，用小规模随机数据比较暴力解和优化解。很多动态规划和贪心题，用对拍能快速发现反例。