当前位置：首页 > news >正文

AI/ML学生持续参与意愿研究：从影响因素到测量模型

news 2026/7/6 8:01:44

1. 项目概述：为什么我们要关心“持续参与意愿”？

在机器学习与人工智能这个领域待了十几年，我见过太多满怀热情入行的学生，从最初的“我要改变世界”到后来的“这行太卷了，我还是考公吧”。这个现象背后，其实藏着一个非常关键但常被忽视的研究课题：究竟是什么在影响学生们对这个领域的“持续参与意愿”？这绝不是一个简单的学术兴趣问题，它直接关系到我们整个行业未来的人才储备、创新活力和技术发展的可持续性。

简单来说，这个研究项目就是要像做一次深度“用户画像”和“留存分析”一样，去系统性地拆解那些让AI/ML专业学生选择留下深耕，或是萌生退意的关键因素。它探讨的不是“如何入门”，而是“如何让入门者真正留下来并成长”。对于高校教育者，这关系到课程设计与培养体系的优化；对于企业导师和团队负责人，这有助于设计更有效的人才培养和激励路径；而对于学生自身，理解这些影响因素，也能更好地进行自我规划与心态调整。

2. 研究核心思路与框架设计

2.1 从“影响因素”到“可测量变量”的转化

做这类研究，最忌讳的就是空谈概念。我们不能只说“兴趣很重要”、“成就感有影响”，而必须把这些模糊的感觉，转化为可以观察、可以测量、可以分析的具体变量。基于多年的行业观察和与大量学生的交流，我通常会将影响因素归纳为几个核心维度，并为其设计对应的测量指标。

1. 个人内在驱动维度：这是最根本的层面，好比汽车的发动机。

兴趣与职业认同：测量指标可以包括学生选择AI/ML作为专业的初衷（是随大流、看好薪资，还是真正的热爱？），以及他们是否将AI从业者视为其理想的职业身份。
自我效能感：即学生对自己能否掌握AI/ML复杂知识和技能的信心。一个总觉得自己“学不会数学推导”、“调不通模型”的学生，持续参与的意愿必然受挫。这可以通过设计量表，测量他们在面对典型任务（如理解一篇顶会论文、完成一个Kaggle比赛）时的信心程度来评估。
成长心态 vs. 固定心态：持有成长心态的学生相信能力可以通过努力提升，会将挑战视为学习机会；而固定心态者则认为能力天生注定，容易在遇到困难时退缩。这个维度可以通过心理学成熟量表进行测量。

2. 外部环境支持维度：这好比汽车行驶的道路和加油站。

教育环境质量：包括课程设置的实用性（是偏重理论推导还是包含足够的项目实践？）、教师的指导水平与投入度、实验资源的充足性（是否有足够的GPU算力？）。
社群与同伴影响：是否有积极的学习小组、实验室氛围？同伴之间是良性竞争、互助共进，还是内卷压抑？来自学长学姐或同辈的正面激励（“我学长去了大厂核心组”）或负面反馈（“师兄说这行天天加班”），影响巨大。
产业与职业前景感知：学生对行业技术迭代速度、就业市场饱和度、长期职业发展路径的认知。这受到媒体报道、招聘会信息、实习经历等外部信息的强烈影响。

3. 过程体验与反馈维度：这是驾驶过程中的实时路况和导航反馈。

学习挑战与技能匹配度：学习任务的难度是否与学生当前技能水平相匹配？长期处于“痛苦区”（太难）会导致挫败，长期处于“舒适区”（太易）则会导致无聊。适度的挑战和即时的正反馈是关键。
项目实践与成就感：学生是否有机会参与有意义的、能看到实际产出（哪怕是小成果）的项目？一次成功的课程设计、一个解决了实际问题的模型部署，带来的成就感是持续学习最强的燃料。
挫折应对与归因方式：当模型不收敛、比赛排名靠后时，学生是将失败归因于“自己能力不足”（内部稳定归因，有害），还是“这次数据有问题”或“方法需要调整”（外部或不稳定归因，有益）？这直接影响其韧性。

注意：在设计测量工具（如问卷、访谈提纲）时，务必避免引导性问题。不要问“你是否因为课程有趣而愿意继续学习？”，而应该分别测量“你对课程趣味性的评价”（1-5分）和“你继续从事AI领域的意愿”（1-5分），然后通过统计分析探究两者的相关性。

2.2 研究方法选型：定量与定性的“组合拳”

单纯发问卷做统计分析（定量研究），容易丢失深度的、情境化的故事；而只做访谈（定性研究），结论又可能缺乏普遍性。因此，一个稳健的设计是采用混合方法：

第一阶段：广度扫描（定量问卷）
- 目标：大规模收集数据，验证各假设因素与持续意愿之间的相关性强度，并建立初步的统计模型。
- 操作：设计包含上述各维度测量题项的结构化问卷，通过高校院系、技术社群、线上平台发放。样本量应力求充足（如N>300），并涵盖不同年级、不同学校层次的学生，以增加结论的普适性。
- 关键分析：使用相关性分析、回归分析（如逻辑回归用于预测“留下/离开”的二元结果）、结构方程模型等，找出哪些因素是显著的预测变量。
第二阶段：深度挖掘（定性访谈）
- 目标：理解定量数据背后的“为什么”。那些在问卷中显示“高意愿”或“低意愿”的极端个案，他们的具体经历和心路历程是怎样的？
- 操作：从问卷受访者中，有目的地选取15-25名具有代表性的学生进行半结构化深度访谈。访谈问题应开放，例如：“可以描述一次让你特别想继续在AI领域探索的经历吗？”或“有没有某个时刻让你感到动摇或想放弃？当时发生了什么？”
- 关键分析：对访谈录音进行转录，采用主题分析法，提炼出共性的叙事模式、关键事件和转折点。
第三阶段：数据融合与解释
- 将定量结果与定性发现进行对比和互证。例如，定量发现“教师指导”因素相关性很强，定性访谈中可能揭示出“有效的指导不在于时长，而在于能否在学生卡壳时给出关键点拨”这一深层机制。

3. 核心环节实操：问卷设计与深度访谈

3.1 设计一份“能挖出真东西”的调查问卷

问卷质量直接决定定量研究的成败。以下是几个核心要点和避坑指南：

量表选择与改编：

对于“自我效能感”、“成长心态”等心理学构念，强烈建议直接使用或基于成熟的学术量表进行情境化改编，而不是自己凭空编题。例如，采用Chen等人（2001）的“计算机自我效能量表”并修改为“AI/ML自我效能量表”。这能保证测量的信度和效度。
所有量表题项应使用李克特五点或七点计分（如“1=非常不同意”到“5=非常同意”）。

关键自变量测量示例：

兴趣与认同：
- “我认为从事AI/ML工作能很好地实现我的人生价值。”（认同感）
- “即使没有外部奖励，我也愿意花时间钻研AI/ML问题。”（内在兴趣）
环境感知：
- “我们专业的课程项目让我觉得所学知识能解决实际问题。”（课程实用性）
- “我很容易获得进行AI实验所需的计算资源（如GPU）。”（资源可及性）
过程体验：
- “在完成一个AI项目后，我通常能获得强烈的成就感。”
- “当我的模型效果不佳时，我倾向于认为这是改进算法的好机会。”（积极归因）

因变量测量：

持续参与意愿：这是核心结果变量。应使用多题项测量以提高可靠性，例如：
- “我计划在未来长期从事与AI/ML相关的工作。”
- “如果有机会转到一个更轻松的专业，我不会考虑。”（反向计分）
- “我愿意为提升AI/ML技能投入大量的业余时间。”

实操心得：

加入注意力检测题：在问卷中插入一两个如“本题请选择‘非常同意’”的题目，用以筛选无效问卷。
控制变量的重要性：务必收集人口统计学变量（年级、性别、先前编程经验）和学术变量（GPA、已修相关课程），这些可能是重要的控制变量，避免将年级差异造成的影响误归为其他因素。
预测试！预测试！预测试！：在正式发放前，找10-20名目标学生试填，询问他们对题目的理解是否有歧义，完成问卷大约需要多久。根据反馈调整表述，确保问卷流畅、易懂。

3.2 执行有深度的“故事挖掘”访谈

定性访谈不是闲聊，需要有清晰的提纲和访谈技巧，目的是引导受访者讲述具体的故事。

访谈提纲设计（示例节选）：

热身与背景：“当初是什么吸引你选择AI/ML这个方向？可以回忆一下当时的情景吗？”
高峰体验挖掘：“在你学习AI的过程中，有没有一个项目或时刻，让你特别兴奋、有成就感，觉得‘这玩意儿太酷了，我要继续干下去’？请详细描述一下当时的情况、你的角色、以及为什么它对你影响这么大。”
低谷体验挖掘：“相反，有没有遇到过特别挫败、甚至让你怀疑自己是否适合这个领域的困难时刻？你是如何度过的？当时最希望得到什么样的帮助？”
环境感知：“你所在的实验室/项目组/同学圈子的氛围是怎样的？这种氛围对你的学习动力有什么具体的影响？”
未来展望：“展望未来3-5年，你对自己在AI领域的发展有怎样的想象？哪些因素会让你这个想象更可能实现，哪些因素可能会成为障碍？”

访谈技巧与注意事项：

建立信任，保持中立：开场明确说明研究目的和保密原则。访谈中切忌评判或引导，多用“然后呢？”“可以举个例子吗？”“你当时的感受是怎样的？”等追问方式，挖掘细节。
聚焦具体事件：避免受访者泛泛而谈（如“我觉得老师都挺好”），要追问具体事例（如“能说说哪位老师在什么事情上给了你特别大的帮助吗？”）。
做好记录与备忘：在征得同意后录音，同时记录关键的非语言信息和自己的即时思考（备忘录）。访谈结束后24小时内，应对录音进行转录和初步分析，此时记忆最鲜活。

4. 数据分析策略与模型构建

4.1 定量数据分析流程

数据回收后，使用SPSS、R或Python（pandas,statsmodels,scikit-learn）进行分析。

数据清洗与准备：
- 剔除无效问卷（如答题时间过短、注意力检测题错误）。
- 处理缺失值（对于量表，若个别题目缺失，可用该维度其他题目的均值替代；缺失过多则考虑删除该样本）。
- 计算每个维度的总分或均值（例如，将测量“自我效能感”的5个题项得分加总或取平均，得到该学生的效能感分数）。
- 进行信度检验（克隆巴赫阿尔法系数），通常要求大于0.7，证明量表内部一致性良好。
描述性统计与相关分析：
- 报告各变量的均值、标准差，对持续意愿在不同群体（如不同年级、性别）间的差异进行t检验或方差分析。
- 计算所有变量间的皮尔逊相关系数矩阵，初步查看哪些因素与持续意愿相关性强。
回归模型构建：
- 核心步骤：以“持续参与意愿”为因变量，将个人内在因素、环境因素、过程体验因素作为自变量，同时将年级、GPA等作为控制变量，纳入多元线性回归模型。
- 模型解读重点：
  - 标准化回归系数（Beta）：比较哪个自变量的影响力更大。例如，可能发现“成就感”的Beta值远高于“课程实用性”，说明对意愿的影响更大。
  - 显著性（p值）：判断该因素是否具有统计学上的显著影响（通常p<0.05）。
  - 模型解释力（R²）：看所有自变量共同解释了“持续意愿”多大比例的变异。在社会科学中，R²达到0.3以上通常就算不错了。
进阶分析尝试：
- 中介效应分析：检验某个因素是否通过影响另一个因素来间接影响意愿。例如，“教师指导”可能通过提升学生的“自我效能感”，进而增强其“持续意愿”。可以使用Process宏或结构方程模型进行检验。
- 调节效应分析：检验某个因素（调节变量）是否会改变其他两个变量之间的关系。例如，“成长心态”可能会调节“遭遇挫折”与“持续意愿”之间的关系——成长心态强的学生，挫折对其意愿的负面影响更小。

4.2 定性数据分析：从文本到主题

访谈转录文本的分析是艺术也是科学。

熟悉化与初始编码：反复阅读转录文本，沉浸到数据中。对文本中有意义的片段（一句话、一个段落）进行初始编码，用简短的标签概括其内容（如“同伴压力”、“调试成功的狂喜”、“对数学的恐惧”）。
寻找主题：将相关的初始编码进行归类、组合，形成更抽象的主题。例如，将“调试成功的狂喜”、“论文复现后的满足感”、“项目被老师表扬”等编码，归类到“微成功体验作为动力源”这一主题下。
主题复审与定义：检查这些主题是否与原始数据匹配，是否彼此独立且完整。为每个主题撰写清晰的定义和描述，并选取最能体现该主题的原始访谈语句作为佐证。
报告撰写：在报告中，不应简单罗列主题，而应通过一个生动的、有代表性的受访者故事来引出和阐述每个主题，使分析栩栩如生。

5. 研究发现的解读与应用建议

假设通过上述分析，我们得出了一些关键发现，那么如何解读并将其转化为 actionable 的建议？

可能的发现与解读示例：

发现1：“项目实践中的即时成就感”与持续意愿的相关性最强（Beta值最高）。
解读与应用：这意味着，与其追求大而全的课程体系，不如在课程中设计更多能让学生快速获得正反馈的小项目、小挑战。例如，在讲完一个基础算法后，立即提供一个清洗好的小数据集，让学生运行代码并看到可视化结果，这种“秒级”的成就感比一个学期后的大作业更能点燃热情。教育者应像设计游戏关卡一样设计学习路径，密集布置“成就感节点”。
发现2：“同伴互助氛围”是重要的环境支持因素，但其作用被“同伴间过度竞争”所削弱。
解读与应用：鼓励合作而非单纯竞争。可以设计必须由小组协作完成的项目，并建立机制鼓励知识分享（如定期举办“技术茶话会”，让学生分享自己踩过的坑）。实验室或班级应刻意营造“我们是一个团队，共同面对AI挑战”的文化，而非“你比我多发一篇论文”的排位文化。
发现3：定量显示“教师指导”影响显著，但定性访谈揭示，学生最看重的是“非计划性的、基于具体问题的点拨”，而非固定的办公室时间。
解读与应用：教师和导师可以改变指导方式。除了固定答疑，更应鼓励学生在遇到瓶颈时随时通过在线协作工具（如Slack频道）提问，并建立一种“快速响应”的文化。导师的指导可以更“敏捷”，针对具体代码错误、模型调参困惑进行几分钟的精准指导，其效果可能优于一小时的泛泛而谈。
发现4：对“行业内卷和职业焦虑”的感知，在高年级学生中显著降低其持续意愿。
解读与应用：学校和企业需要提供更清晰的、多元化的职业路径指引。邀请不同发展路径（如顶尖研究院、工业界应用、创业、跨界）的校友进行分享，让学生看到AI领域的可能性远不止“发顶会”和“进大厂”两条独木桥。降低“未知”带来的焦虑感。

6. 研究的局限与未来延伸方向

任何研究都有其边界，坦诚地说明局限性能增加研究的可信度，并为后续工作指明方向。

本类研究常见的局限性：

样本代表性问题：研究可能集中于某一类高校（如重点院校），其结论可能不适用于所有类型院校的学生。
横截面数据：本研究通常在某个时间点收集数据（横截面研究），只能揭示因素间的相关关系，难以严格断定因果关系。例如，是“高成就感”导致了“高持续意愿”，还是因为“意愿强”的学生更善于从项目中获得成就感？
自我报告偏差：问卷和访谈数据均基于学生自我报告，可能存在社会赞许性偏差（倾向于给出“正确”而非真实的答案）。

未来可延伸的方向：

纵向追踪研究：对同一批学生进行为期数年（如从大一到大四）的追踪调查，能更清晰地揭示影响因素随时间变化的动态过程，以及哪些因素是预测长期坚持的关键。
跨文化比较研究：比较不同国家、不同教育体制下，影响AI学生持续意愿的因素有何异同，可以从更宏观的文化和社会层面理解问题。
干预实验研究：基于研究发现设计教育干预措施（如引入一套新的基于“微成功”的项目式学习方案），并通过随机对照实验检验其是否能有效提升学生的持续意愿，将研究推向实践和应用的最前沿。

做这项研究的过程，本身就是一个与AI领域未来建设者深度对话的过程。它要求我们不仅关注技术本身，更要关注创造技术的人。最终，我们希望这份研究能像一份“指南针”和“听诊器”，既为前行者指明哪些路径更可能通向热爱与坚持，也为培养者们提供诊断教育生态健康度的工具，让我们共同构建一个能让更多人才持续闪耀的AI未来。

查看全文

http://www.jsqmd.com/news/787957/