AI/ML学生持续参与意愿研究:从影响因素到测量模型
1. 项目概述:为什么我们要关心“持续参与意愿”?
在机器学习与人工智能这个领域待了十几年,我见过太多满怀热情入行的学生,从最初的“我要改变世界”到后来的“这行太卷了,我还是考公吧”。这个现象背后,其实藏着一个非常关键但常被忽视的研究课题:究竟是什么在影响学生们对这个领域的“持续参与意愿”?这绝不是一个简单的学术兴趣问题,它直接关系到我们整个行业未来的人才储备、创新活力和技术发展的可持续性。
简单来说,这个研究项目就是要像做一次深度“用户画像”和“留存分析”一样,去系统性地拆解那些让AI/ML专业学生选择留下深耕,或是萌生退意的关键因素。它探讨的不是“如何入门”,而是“如何让入门者真正留下来并成长”。对于高校教育者,这关系到课程设计与培养体系的优化;对于企业导师和团队负责人,这有助于设计更有效的人才培养和激励路径;而对于学生自身,理解这些影响因素,也能更好地进行自我规划与心态调整。
2. 研究核心思路与框架设计
2.1 从“影响因素”到“可测量变量”的转化
做这类研究,最忌讳的就是空谈概念。我们不能只说“兴趣很重要”、“成就感有影响”,而必须把这些模糊的感觉,转化为可以观察、可以测量、可以分析的具体变量。基于多年的行业观察和与大量学生的交流,我通常会将影响因素归纳为几个核心维度,并为其设计对应的测量指标。
1. 个人内在驱动维度:这是最根本的层面,好比汽车的发动机。
- 兴趣与职业认同:测量指标可以包括学生选择AI/ML作为专业的初衷(是随大流、看好薪资,还是真正的热爱?),以及他们是否将AI从业者视为其理想的职业身份。
- 自我效能感:即学生对自己能否掌握AI/ML复杂知识和技能的信心。一个总觉得自己“学不会数学推导”、“调不通模型”的学生,持续参与的意愿必然受挫。这可以通过设计量表,测量他们在面对典型任务(如理解一篇顶会论文、完成一个Kaggle比赛)时的信心程度来评估。
- 成长心态 vs. 固定心态:持有成长心态的学生相信能力可以通过努力提升,会将挑战视为学习机会;而固定心态者则认为能力天生注定,容易在遇到困难时退缩。这个维度可以通过心理学成熟量表进行测量。
2. 外部环境支持维度:这好比汽车行驶的道路和加油站。
- 教育环境质量:包括课程设置的实用性(是偏重理论推导还是包含足够的项目实践?)、教师的指导水平与投入度、实验资源的充足性(是否有足够的GPU算力?)。
- 社群与同伴影响:是否有积极的学习小组、实验室氛围?同伴之间是良性竞争、互助共进,还是内卷压抑?来自学长学姐或同辈的正面激励(“我学长去了大厂核心组”)或负面反馈(“师兄说这行天天加班”),影响巨大。
- 产业与职业前景感知:学生对行业技术迭代速度、就业市场饱和度、长期职业发展路径的认知。这受到媒体报道、招聘会信息、实习经历等外部信息的强烈影响。
3. 过程体验与反馈维度:这是驾驶过程中的实时路况和导航反馈。
- 学习挑战与技能匹配度:学习任务的难度是否与学生当前技能水平相匹配?长期处于“痛苦区”(太难)会导致挫败,长期处于“舒适区”(太易)则会导致无聊。适度的挑战和即时的正反馈是关键。
- 项目实践与成就感:学生是否有机会参与有意义的、能看到实际产出(哪怕是小成果)的项目?一次成功的课程设计、一个解决了实际问题的模型部署,带来的成就感是持续学习最强的燃料。
- 挫折应对与归因方式:当模型不收敛、比赛排名靠后时,学生是将失败归因于“自己能力不足”(内部稳定归因,有害),还是“这次数据有问题”或“方法需要调整”(外部或不稳定归因,有益)?这直接影响其韧性。
注意:在设计测量工具(如问卷、访谈提纲)时,务必避免引导性问题。不要问“你是否因为课程有趣而愿意继续学习?”,而应该分别测量“你对课程趣味性的评价”(1-5分)和“你继续从事AI领域的意愿”(1-5分),然后通过统计分析探究两者的相关性。
2.2 研究方法选型:定量与定性的“组合拳”
单纯发问卷做统计分析(定量研究),容易丢失深度的、情境化的故事;而只做访谈(定性研究),结论又可能缺乏普遍性。因此,一个稳健的设计是采用混合方法:
第一阶段:广度扫描(定量问卷)
- 目标:大规模收集数据,验证各假设因素与持续意愿之间的相关性强度,并建立初步的统计模型。
- 操作:设计包含上述各维度测量题项的结构化问卷,通过高校院系、技术社群、线上平台发放。样本量应力求充足(如N>300),并涵盖不同年级、不同学校层次的学生,以增加结论的普适性。
- 关键分析:使用相关性分析、回归分析(如逻辑回归用于预测“留下/离开”的二元结果)、结构方程模型等,找出哪些因素是显著的预测变量。
第二阶段:深度挖掘(定性访谈)
- 目标:理解定量数据背后的“为什么”。那些在问卷中显示“高意愿”或“低意愿”的极端个案,他们的具体经历和心路历程是怎样的?
- 操作:从问卷受访者中,有目的地选取15-25名具有代表性的学生进行半结构化深度访谈。访谈问题应开放,例如:“可以描述一次让你特别想继续在AI领域探索的经历吗?”或“有没有某个时刻让你感到动摇或想放弃?当时发生了什么?”
- 关键分析:对访谈录音进行转录,采用主题分析法,提炼出共性的叙事模式、关键事件和转折点。
第三阶段:数据融合与解释
- 将定量结果与定性发现进行对比和互证。例如,定量发现“教师指导”因素相关性很强,定性访谈中可能揭示出“有效的指导不在于时长,而在于能否在学生卡壳时给出关键点拨”这一深层机制。
3. 核心环节实操:问卷设计与深度访谈
3.1 设计一份“能挖出真东西”的调查问卷
问卷质量直接决定定量研究的成败。以下是几个核心要点和避坑指南:
量表选择与改编:
- 对于“自我效能感”、“成长心态”等心理学构念,强烈建议直接使用或基于成熟的学术量表进行情境化改编,而不是自己凭空编题。例如,采用Chen等人(2001)的“计算机自我效能量表”并修改为“AI/ML自我效能量表”。这能保证测量的信度和效度。
- 所有量表题项应使用李克特五点或七点计分(如“1=非常不同意”到“5=非常同意”)。
关键自变量测量示例:
- 兴趣与认同:
- “我认为从事AI/ML工作能很好地实现我的人生价值。”(认同感)
- “即使没有外部奖励,我也愿意花时间钻研AI/ML问题。”(内在兴趣)
- 环境感知:
- “我们专业的课程项目让我觉得所学知识能解决实际问题。”(课程实用性)
- “我很容易获得进行AI实验所需的计算资源(如GPU)。”(资源可及性)
- 过程体验:
- “在完成一个AI项目后,我通常能获得强烈的成就感。”
- “当我的模型效果不佳时,我倾向于认为这是改进算法的好机会。”(积极归因)
因变量测量:
- 持续参与意愿:这是核心结果变量。应使用多题项测量以提高可靠性,例如:
- “我计划在未来长期从事与AI/ML相关的工作。”
- “如果有机会转到一个更轻松的专业,我不会考虑。”(反向计分)
- “我愿意为提升AI/ML技能投入大量的业余时间。”
实操心得:
- 加入注意力检测题:在问卷中插入一两个如“本题请选择‘非常同意’”的题目,用以筛选无效问卷。
- 控制变量的重要性:务必收集人口统计学变量(年级、性别、先前编程经验)和学术变量(GPA、已修相关课程),这些可能是重要的控制变量,避免将年级差异造成的影响误归为其他因素。
- 预测试!预测试!预测试!:在正式发放前,找10-20名目标学生试填,询问他们对题目的理解是否有歧义,完成问卷大约需要多久。根据反馈调整表述,确保问卷流畅、易懂。
3.2 执行有深度的“故事挖掘”访谈
定性访谈不是闲聊,需要有清晰的提纲和访谈技巧,目的是引导受访者讲述具体的故事。
访谈提纲设计(示例节选):
- 热身与背景:“当初是什么吸引你选择AI/ML这个方向?可以回忆一下当时的情景吗?”
- 高峰体验挖掘:“在你学习AI的过程中,有没有一个项目或时刻,让你特别兴奋、有成就感,觉得‘这玩意儿太酷了,我要继续干下去’?请详细描述一下当时的情况、你的角色、以及为什么它对你影响这么大。”
- 低谷体验挖掘:“相反,有没有遇到过特别挫败、甚至让你怀疑自己是否适合这个领域的困难时刻?你是如何度过的?当时最希望得到什么样的帮助?”
- 环境感知:“你所在的实验室/项目组/同学圈子的氛围是怎样的?这种氛围对你的学习动力有什么具体的影响?”
- 未来展望:“展望未来3-5年,你对自己在AI领域的发展有怎样的想象?哪些因素会让你这个想象更可能实现,哪些因素可能会成为障碍?”
访谈技巧与注意事项:
- 建立信任,保持中立:开场明确说明研究目的和保密原则。访谈中切忌评判或引导,多用“然后呢?”“可以举个例子吗?”“你当时的感受是怎样的?”等追问方式,挖掘细节。
- 聚焦具体事件:避免受访者泛泛而谈(如“我觉得老师都挺好”),要追问具体事例(如“能说说哪位老师在什么事情上给了你特别大的帮助吗?”)。
- 做好记录与备忘:在征得同意后录音,同时记录关键的非语言信息和自己的即时思考(备忘录)。访谈结束后24小时内,应对录音进行转录和初步分析,此时记忆最鲜活。
4. 数据分析策略与模型构建
4.1 定量数据分析流程
数据回收后,使用SPSS、R或Python(pandas,statsmodels,scikit-learn)进行分析。
数据清洗与准备:
- 剔除无效问卷(如答题时间过短、注意力检测题错误)。
- 处理缺失值(对于量表,若个别题目缺失,可用该维度其他题目的均值替代;缺失过多则考虑删除该样本)。
- 计算每个维度的总分或均值(例如,将测量“自我效能感”的5个题项得分加总或取平均,得到该学生的效能感分数)。
- 进行信度检验(克隆巴赫阿尔法系数),通常要求大于0.7,证明量表内部一致性良好。
描述性统计与相关分析:
- 报告各变量的均值、标准差,对持续意愿在不同群体(如不同年级、性别)间的差异进行t检验或方差分析。
- 计算所有变量间的皮尔逊相关系数矩阵,初步查看哪些因素与持续意愿相关性强。
回归模型构建:
- 核心步骤:以“持续参与意愿”为因变量,将个人内在因素、环境因素、过程体验因素作为自变量,同时将年级、GPA等作为控制变量,纳入多元线性回归模型。
- 模型解读重点:
- 标准化回归系数(Beta):比较哪个自变量的影响力更大。例如,可能发现“成就感”的Beta值远高于“课程实用性”,说明对意愿的影响更大。
- 显著性(p值):判断该因素是否具有统计学上的显著影响(通常p<0.05)。
- 模型解释力(R²):看所有自变量共同解释了“持续意愿”多大比例的变异。在社会科学中,R²达到0.3以上通常就算不错了。
进阶分析尝试:
- 中介效应分析:检验某个因素是否通过影响另一个因素来间接影响意愿。例如,“教师指导”可能通过提升学生的“自我效能感”,进而增强其“持续意愿”。可以使用Process宏或结构方程模型进行检验。
- 调节效应分析:检验某个因素(调节变量)是否会改变其他两个变量之间的关系。例如,“成长心态”可能会调节“遭遇挫折”与“持续意愿”之间的关系——成长心态强的学生,挫折对其意愿的负面影响更小。
4.2 定性数据分析:从文本到主题
访谈转录文本的分析是艺术也是科学。
- 熟悉化与初始编码:反复阅读转录文本,沉浸到数据中。对文本中有意义的片段(一句话、一个段落)进行初始编码,用简短的标签概括其内容(如“同伴压力”、“调试成功的狂喜”、“对数学的恐惧”)。
- 寻找主题:将相关的初始编码进行归类、组合,形成更抽象的主题。例如,将“调试成功的狂喜”、“论文复现后的满足感”、“项目被老师表扬”等编码,归类到“微成功体验作为动力源”这一主题下。
- 主题复审与定义:检查这些主题是否与原始数据匹配,是否彼此独立且完整。为每个主题撰写清晰的定义和描述,并选取最能体现该主题的原始访谈语句作为佐证。
- 报告撰写:在报告中,不应简单罗列主题,而应通过一个生动的、有代表性的受访者故事来引出和阐述每个主题,使分析栩栩如生。
5. 研究发现的解读与应用建议
假设通过上述分析,我们得出了一些关键发现,那么如何解读并将其转化为 actionable 的建议?
可能的发现与解读示例:
发现1:“项目实践中的即时成就感”与持续意愿的相关性最强(Beta值最高)。
解读与应用:这意味着,与其追求大而全的课程体系,不如在课程中设计更多能让学生快速获得正反馈的小项目、小挑战。例如,在讲完一个基础算法后,立即提供一个清洗好的小数据集,让学生运行代码并看到可视化结果,这种“秒级”的成就感比一个学期后的大作业更能点燃热情。教育者应像设计游戏关卡一样设计学习路径,密集布置“成就感节点”。
发现2:“同伴互助氛围”是重要的环境支持因素,但其作用被“同伴间过度竞争”所削弱。
解读与应用:鼓励合作而非单纯竞争。可以设计必须由小组协作完成的项目,并建立机制鼓励知识分享(如定期举办“技术茶话会”,让学生分享自己踩过的坑)。实验室或班级应刻意营造“我们是一个团队,共同面对AI挑战”的文化,而非“你比我多发一篇论文”的排位文化。
发现3:定量显示“教师指导”影响显著,但定性访谈揭示,学生最看重的是“非计划性的、基于具体问题的点拨”,而非固定的办公室时间。
解读与应用:教师和导师可以改变指导方式。除了固定答疑,更应鼓励学生在遇到瓶颈时随时通过在线协作工具(如Slack频道)提问,并建立一种“快速响应”的文化。导师的指导可以更“敏捷”,针对具体代码错误、模型调参困惑进行几分钟的精准指导,其效果可能优于一小时的泛泛而谈。
发现4:对“行业内卷和职业焦虑”的感知,在高年级学生中显著降低其持续意愿。
解读与应用:学校和企业需要提供更清晰的、多元化的职业路径指引。邀请不同发展路径(如顶尖研究院、工业界应用、创业、跨界)的校友进行分享,让学生看到AI领域的可能性远不止“发顶会”和“进大厂”两条独木桥。降低“未知”带来的焦虑感。
6. 研究的局限与未来延伸方向
任何研究都有其边界,坦诚地说明局限性能增加研究的可信度,并为后续工作指明方向。
本类研究常见的局限性:
- 样本代表性问题:研究可能集中于某一类高校(如重点院校),其结论可能不适用于所有类型院校的学生。
- 横截面数据:本研究通常在某个时间点收集数据(横截面研究),只能揭示因素间的相关关系,难以严格断定因果关系。例如,是“高成就感”导致了“高持续意愿”,还是因为“意愿强”的学生更善于从项目中获得成就感?
- 自我报告偏差:问卷和访谈数据均基于学生自我报告,可能存在社会赞许性偏差(倾向于给出“正确”而非真实的答案)。
未来可延伸的方向:
- 纵向追踪研究:对同一批学生进行为期数年(如从大一到大四)的追踪调查,能更清晰地揭示影响因素随时间变化的动态过程,以及哪些因素是预测长期坚持的关键。
- 跨文化比较研究:比较不同国家、不同教育体制下,影响AI学生持续意愿的因素有何异同,可以从更宏观的文化和社会层面理解问题。
- 干预实验研究:基于研究发现设计教育干预措施(如引入一套新的基于“微成功”的项目式学习方案),并通过随机对照实验检验其是否能有效提升学生的持续意愿,将研究推向实践和应用的最前沿。
做这项研究的过程,本身就是一个与AI领域未来建设者深度对话的过程。它要求我们不仅关注技术本身,更要关注创造技术的人。最终,我们希望这份研究能像一份“指南针”和“听诊器”,既为前行者指明哪些路径更可能通向热爱与坚持,也为培养者们提供诊断教育生态健康度的工具,让我们共同构建一个能让更多人才持续闪耀的AI未来。
