创新实训开发日志:研途Buddy(七)
刷题统计与智能学习报告中心的设计与实现
在完成了刷题模式下的 AI 错因分析、自适应主观题阅卷与相似题生成后,系统已经在单道题目上形成了良好的教学闭环。然而,当刷题量从几十道变成几百道,乃至覆盖到 408 统考四大科目即数据结构、计算机组成原理、操作系统、计算机网络的庞大知识体系时,零散的刷题记录需要被整合分析。 考生面对成百上千条对错记录,依然无法看清自己的复习现状,也难以在大后期制定出精确到天的冲刺计划。因此,本阶段的核心任务是从零构建刷题统计与智能学习报告中心。以下是我在开发这些功能小点时需求推演、技术选型以及大模型落地过程中的真实思考。
一、 基础量化构建:核心数据统计
1. 考生需求
408 考研是一场持久战,考生在复习中很容易产生两种极端心态:(1)盲目乐观: 刷了几十道简单题,就觉得科目复习得差不多了。(2)过度焦虑: 碰上几道复杂的大题连着错,就觉得自己今年考不上了。
为了打破这种主观盲目性,考虑在统计页面要给考生提供几个重要的量化指标:
(1)累计刷题总数:
让考生对自己的总工作量心里有数。这里在后端我直接对做题记录表Record进行聚合统计,通过对用户 ID 和考试模式进行计数。
(2)综合平均正确率:
可以直观反映当前的掌握水平,也是通过做题记录表进行计算统计的。
(3)累计精力花费时长:
把做题数量转化为时间维度,判断用户的精力与能力。为了强化复习进度的判断,这里定义了一个简单合理的精力消耗公式:总消耗分钟数 = 总刷题数 x 3。把冰冷的题目数字转化为专注时间,在心理上能帮考生稳定备考心态,踏踏实实看到自己的沉淀。
2.近一周 408 刷题状态与正确率波动
在核心统计之外,对考生来说,动态地统计最近 7 天的复习节奏与状态波动也是必要的。于是在这里设计了一个动态的折线柱状混合图表。
(1)每日刷题数量量化(柱状图)
提取近 7 天内该用户的所有做题记录,初始化近7天的时间。将每天的答题总数聚合统计后映射为图表中的柱状高度。考生可以清晰看到周一到周日自己哪天刷题最猛,哪天复习出现了懈怠。
(2)每日正确率起伏走势(折线图)
在柱状图的基础上叠加了一条折线图走势线,用来反映每天的做题正确率变动趋势。通过柱状图与折线图的结合,考生能一眼看出自己近期的掌握状态是质量和数量都保证的良性循环,还是疲劳的低效刷题,从而动态微调第二天的复习节奏。
3. 408 四大科目复习刷题明细盘
考虑到考生需要知道自己在数据结构、计组、操作系统、计网这四个科目中,每个科目到底各自刷了多少道题,各自的对错分布是什么样的。
所以对做题表按照四大科目进行分组,提取出每个科目下独立的总做题数、正确题目数和错误题目数。并计算了该科目的正确率。利用前端进度条进行可视化展示,考生看到四大科目的阶梯差距,彻底扫除复习时的盲区。
二、 408科目正确率雷达图可视化
在做数据结构、计组、操作系统、计网这四大科目的胜率雷达图时,我遇到了问题:新用户的数据极其稀疏。如果一个用户刚注册,或者刚开始一轮复习,如果直接拿数据库里的真实正确率去前端渲染雷达图,图表会严重变形(比如数据结构 100%,其余全打底)。这种图表不仅没有参考价值,还很影响用户体验。
这里解决方案是设计了一套基于 408 常规难度的自适应动态拟合算法。
首先,根据历年统考的难度分布,设定了四大科目的初始基准线,数据结构为75% 、计算机网络为70%、操作系统为60%和计算机组成原理为55%。引入了题量动态加权公式来计算最终的展示准确率,当用户在系统中的总做题数 N < 200道时,我们认为样本较小,容易失真。此时启用动态拟合:,当用户总做题数 N ≥200 道时,
自动衰减为 0,系统完全展现百分之百由数据库采集的真实表现。
最终展示正确率=x 常规模拟基准线 + (1 -
) x 用户真实刷题正确率
另外在科目分类上,在采集数据时就已经严格清洗了,剔除了其它这种边缘分类。因为 408 统考大纲只有四大硬核科目,保持类别的纯净感能让报告显得更专业。
在雷达图可视化上,当用户鼠标悬浮在雷达图时,动态气泡框会清晰展示各科目的正确率。
三、 长期统计分析
1. 12周自律打卡状态
为了引导考生建立每日迭代的习惯,我们在前端复刻了类似力扣的打卡热力图墙。 用户可以每天签到打卡,系统提取用户近 90 天的真实轨迹,根据每日的刷题数和签到动作映射为小色块。
其中设置了四个不同浓度的绿色像素块。绿色变浓是刷题数的量化,能给考生正向心理暗示;而空白的色块则能警醒考生及时补上,用视觉引导考生自律。
2. 近期薄弱考点排行
统计不仅要展示好的一面,更要展示需要改进的刷题上的漏洞点。系统对知识点进行精细化聚合,按照正确率升序、做题数降序的原则,筛选出排名前5的严重薄弱点。
同时设置了自适应诊断评级系统,根据薄弱点的真实正确率划分了诊断评级与解决方法。评级包含薄弱和极度危险,解决方法是启动薄弱知识点重做机制。 利用系统的 AI 相似题生成功能进行同考点、换参数的方法,来加强薄弱知识点掌握。
四、 大模型 AI 学情分析与自适应交互
前期的统计是静态的,无法动态说明复习路径。所以这里我考虑调用 AI 来做学习报告的决策和规划。
1.ai动态学情分析
传统的统计只能从数字分析,无法动态给出后续采取的方法。所以我引入大模型来给出动态的分析,把大模型包装成一名考研总复习规划专家,实时提取底层的核心概览等结构化数据注入 Prompt,让它给考生输出一份专业的学情分析与后续主线任务规划。
2. Top1 薄弱点快捷互动指令
除了针对薄弱和掌握点的学情分析报告,又设计了Top1薄弱点的快捷互动泡泡。点击考点深度解剖按钮后,大模型会调取该考点在历年真题中的考察题型与分值分布,同时卡片下方会直接显示大模型给出的专项主线任务规划,要求包含三个具体的复习阶段与时间节点,真正实现了薄弱点挖掘--深度解剖--薄弱练习的闭环,帮助考生看清未来的复习路径。
总结
在各个功能的落地中,我最大的体会是工程逻辑与 AI 决策的互补性。不能盲目地把所有数据处理都推给大模型,而是用传统的 SQL 聚合提供最精准的数字,用数学公式解决数据稀疏等各类问题,最后把高层次的文本分析、快捷泡泡互动以及专项组卷路径重组交给大模型发挥。这种结构设计既保证了系统的稳健,又发挥了 AI 的自适应优势,真正满足了考生长期复习 408 时的需求。
