AI学习持久性研究:社会归属感与编程信心如何影响学生坚持
1. 项目概述:为什么我们要关心“坚持”这件事?
在机器学习与人工智能这个领域待久了,你可能会发现一个有趣的现象:每年都有大量充满热情的学生涌入,但几年后,真正能在这个领域深耕并做出成绩的,似乎总是少数。我自己带过不少学生,也见过很多同行分享类似的观察。这背后,除了众所周知的“技术门槛高”、“数学要求严”之外,还有什么更深层次的因素在起作用?这就是“学生持久性”研究试图回答的问题。
简单来说,“持久性”就是指学生在面对挑战时,能否持续投入、不轻易放弃,并最终在AI/ML领域完成学业或开启职业生涯。这不仅仅是个人毅力问题,更是一个复杂的系统性问题。我们这次的研究,聚焦于两个看似“软性”,实则至关重要的心理社会因素:社会归属感和编程信心。前者关乎“我是否属于这里”,后者关乎“我是否相信自己能搞定”。当一名学生既感到自己是这个技术社区的一份子,又对自己的编程能力有足够信心时,他/她坚持下去的可能性就会大大增加。
这项研究的意义在于,它试图将那些模糊的“感觉”量化,并找出它们与具体学习行为、职业选择之间的因果关系。对于教育者,这意味着可以设计更有效的教学干预措施;对于学生,这能帮助他们更好地进行自我诊断和调整;对于整个行业,这关乎未来人才梯队的稳定与质量。接下来,我将拆解我们是如何设计并执行这项研究的,希望能为关注AI教育、团队建设或个人成长的朋友们提供一些切实的参考。
2. 研究设计与核心思路拆解
2.1 核心变量定义与测量工具选择
任何严谨的研究,第一步都是清晰地定义你要测量的东西。在我们的语境下:
社会归属感,并非指简单的“有朋友”,而是指学生在AI/ML学术或实践社区中,感受到自己被接纳、被重视、与群体目标一致,并相信自己的价值被认可的程度。它解决的是“我在这里是否感到安全、被支持”的问题。为了测量它,我们没有简单地问“你觉得有归属感吗?”,而是采用了经过验证的量表,例如改编自Good等人的《归属感量表》。量表会包含一系列陈述,如“在机器学习课程的小组讨论中,我的意见会被认真考虑”、“我觉得系里的老师和同学会把我当作‘自己人’”,让学生从“非常不同意”到“非常同意”进行打分。这种多点李克特量表能更细腻地捕捉感受的强度。
编程信心,特指在面对AI/ML领域典型的编程任务时,个体对自身成功完成该任务的能力的信念。它不等于实际的编程技能,而是一种主观评估。一个技能不错但信心不足的学生,可能更容易在遇到bug时产生“我果然不行”的念头而放弃。我们使用了《计算机编程自我效能感量表》的修订版,聚焦于AI场景下的任务,例如:“我有信心能够独立调试一个导致模型训练Loss不下降的TensorFlow/PyTorch程序”、“我有信心能够阅读并理解一篇顶会论文中涉及的核心代码片段”。
持久性,是我们的因变量。我们将其操作化为几个可观测的指标:1)课程坚持:是否完成了高阶的ML/AI课程;2)项目完成度:在课程或自主项目中,是否坚持到提交最终成果;3)职业意向:毕业后是否寻求并从事AI/ML相关的工作;4)持续学习行为:是否在课程之外,持续参与开源项目、线上竞赛(如Kaggle)或进行自主学习。
选择这些变量和测量工具,是基于大量的文献综述和预研究。我们发现,单纯用“是否退课”来衡量持久性过于粗糙,而结合行为与意向的多维度指标,能更全面地反映学生的长期投入状态。
2.2 研究模型与假设建立
基于社会认知理论、归属感理论以及我们前期的访谈,我们提出了一个核心研究模型。这个模型假设:社会归属感和编程信心共同、且可能交互地影响学生在AI/ML领域的持久性。具体来说,我们验证以下几个假设:
- H1:社会归属感对学生的持久性有显著正向影响。即,归属感越强,坚持的可能性越高。
- H2:编程信心对学生的持久性有显著正向影响。即,信心越强,坚持的可能性越高。
- H3:社会归属感与编程信心存在正相关关系,且可能相互增强。一个友好的社区环境能提升信心,而信心的提升又能让人更积极地参与社区,从而增强归属感。
- H4:编程信心在社会归属感与持久性之间起中介作用。即,归属感部分是通过提升学生的编程信心,进而影响其持久性的。
这个模型的好处在于,它没有把问题简单化。它承认心理因素之间的联动,并试图揭示其内部的作用路径。例如,如果我们发现H4成立,那么教育干预就不能只停留在营造“友好氛围”上,还必须配套提供切实提升编程信心的支持(如更细致的代码辅导、阶梯式的项目挑战),否则效果可能会打折扣。
2.3 研究对象与数据收集策略
我们选择了国内多所开设了成熟AI/ML专业或系列课程的高校,研究对象涵盖本科高年级和硕士研究生。这个阶段的学生已经接触了核心课程,正处于深化学习或确定研究方向的关键期,也是“流失”现象开始显现的时期。
数据收集分三轮进行,横跨一个学年:
- T1(学期初):测量基线水平的社会归属感和编程信心,并收集背景信息(如先修课程成绩、前期编程经验)。
- T2(学期中):再次测量社会归属感和编程信心,并跟踪中期学习行为(如项目进度、求助频率)。
- T3(学期末/毕业后):测量最终的持久性指标(课程成绩、项目完成情况、职业意向问卷)。
采用纵向追踪设计而非横截面调查,能让我们更好地推断因果关系,观察变量的动态变化。例如,我们能分析学期初的归属感如何预测学期末的项目完成情况,而不是仅仅知道两者相关。
实操心得:问卷发放与回收:在高校做调研,切忌只靠一封群发邮件。我们的策略是“线上+线下”结合,并与任课教师深度合作。在获得教师支持后,我们会在课程开始时用10分钟现场介绍研究意义和保密原则,并让学生当场扫码填写T1问卷(现场填写率可达90%以上)。T2和T3则通过课程邮件列表和少量激励(如抽奖赠送技术书籍)进行追踪。关键是要让学生感到参与这项研究是有价值、被尊重的,而不是一项麻烦的任务。
3. 核心环节实现:数据分析方法与过程
3.1 数据清洗与预处理
收回的问卷第一步是清洗。我们设定了严格的标准:1)剔除答题时间过短(如低于平均时间1/3)的样本;2)剔除规律性作答(如所有题目都选同一个选项)的样本;3)对于有少量缺失值的问卷,如果缺失比例低于5%,则使用多重插补法进行填补,否则剔除。这一步至关重要,低质量数据会直接污染分析结果。
接着,对量表进行信效度检验。我们使用Cronbach‘s α系数来检验量表的内部一致性。通常,α系数大于0.7被认为可以接受,大于0.8则信度良好。我们的归属感量表和编程信心量表的α系数均在0.85以上,表明测量是可靠的。效度方面,我们通过验证性因子分析来检查量表的结构效度,确保每个题目确实负载在它假设的因子上。
3.2 假设检验:回归分析与路径模型
对于H1和H2,我们采用分层回归分析。首先将人口学变量(如性别、前期成绩)作为控制变量放入第一层回归模型,用于预测持久性。在第二层,再将社会归属感和编程信心放入模型。通过观察第二层模型解释力(R²)的显著增加,以及两个核心自变量的回归系数是否显著,来判断它们对持久性的独立影响。
例如,一个简化的回归方程可能看起来像这样:持久性得分 = β0 + β1*性别 + β2*前期成绩 + β3*社会归属感 + β4*编程信心 + ε如果β3和β4都是显著的正数,那么H1和H2就得到了支持。
对于更复杂的H3和H4(中介效应),我们使用了结构方程模型进行路径分析。这是本研究的核心分析手段。我们使用Mplus或R语言的lavaan包来构建和检验模型。
具体操作步骤实录:
- 模型设定:根据我们的理论假设,在软件中绘制路径图。归属感和信心作为外生变量或中介变量,持久性作为内生变量。允许归属感和信心相关。
- 参数估计:采用最大似然估计法。软件会输出每条路径的标准化系数(类似于回归系数)、显著性水平(p值),以及一系列模型拟合指标。
- 模型拟合评价:这是判断模型是否“好用”的关键。我们主要看几个指标:
- χ²/df:小于3表示模型拟合良好(但大样本下该指标敏感)。
- CFI和TLI:比较拟合指数和 Tucker-Lewis指数,大于0.90可接受,大于0.95优秀。
- RMSEA:近似误差均方根,小于0.05优秀,小于0.08良好。
- SRMR:标准化残差均方根,小于0.08良好。 如果模型拟合不佳,我们需要根据修正指数对模型进行微调(如增加某些误差项之间的相关),但必须要有理论依据,不能纯粹数据驱动。
- 中介效应检验:在模型拟合良好的基础上,我们使用Bootstrap法(重复抽样5000次)来检验编程信心的中介效应。如果“归属感→信心→持久性”这条间接路径的95%置信区间不包含0,则表明中介效应显著,H4成立。
注意事项:Bootstrap的妙用:传统的中介效应检验(如Sobel检验)要求数据服从正态分布,而心理测量数据往往难以严格满足。Bootstrap是一种非参数重抽样方法,它不依赖分布假设,通过从原始数据中反复有放回地抽样,构建中介效应的经验分布,从而计算出更稳健的置信区间。这是目前检验中介效应的首选方法。
3.3 交互效应与分组分析
除了主效应和中介效应,我们还探索了归属感与信心之间是否存在交互效应。即,对于编程信心水平不同的学生,归属感对持久性的影响强度是否不同?我们通过在线性回归模型中加入“归属感 x 编程信心”的乘积项来检验。如果乘积项显著,则说明存在交互效应。
此外,我们还进行了分组分析,例如比较不同性别、不同本科背景(计算机vs非计算机)的学生,其核心变量的水平和作用机制是否存在差异。这能帮助我们发现更具针对性的干预切入点。
4. 研究发现与深度解读
经过严谨的数据分析,我们得到了一些非常有意思且具有实践意义的发现。
4.1 社会归属感:不仅仅是“感觉好”
数据强有力地支持了H1。社会归属感是预测学生持久性的最稳定、最强的因素之一。它的影响甚至超过了学生入学时的编程基础成绩。这意味着,一个在技术上起步稍慢,但深深感到自己被实验室、学习小组或院系社区所接纳和支持的学生,更有可能克服困难,坚持下来。
更深入的分析揭示,归属感的不同维度作用不同:
- 学术归属感(如感到自己的学术想法被尊重)与坚持完成高难度课程项目和攻读研究生学位意向关联最强。
- 社交归属感(如在实验室有朋友)则与更低的焦虑水平和更高的日常学习参与度相关。
- 值得注意的是,那种“我必须非常优秀才配留在这里”的“条件性归属感”是有害的。它与更高的倦怠感和退学意向相关。这提醒教育者,营造“无条件接纳”的氛围比单纯鼓励竞争更重要。
4.2 编程信心:关键的“能力信念”
H2同样得到验证。编程信心对持久性,特别是对持续学习行为和职业意向,有着直接的驱动作用。一个典型的发现是:在控制了实际编程能力后,那些高估自己一点点的学生(即信心略高于实际水平),在Kaggle竞赛中尝试更复杂模型的次数更多,坚持的时间也更长。这符合心理学上的“乐观偏差”效应,适度的、积极的自我评估能促进探索和坚持。
我们的路径分析(H4)显示,编程信心承担了约30%-40%的中介效应。也就是说,社会归属感对持久性的影响,有相当一部分是通过“提升学生对自己编程能力的信念”来实现的。一个支持性的环境如何提升信心?访谈数据给出了答案:当学生遇到bug时,来自同伴或导师的一句“这个问题很典型,我们一起来看看”而不是“这很简单”,能极大地保护其信心;当学生完成一个小模块时,及时的、具体的正面反馈(“你这个数据预处理的方法想得很巧妙”)能有效强化其信心。
4.3 交互效应:当归属感遇上信心
我们发现了显著的交互效应。对于编程信心较低的学生,社会归属感的提升对他们坚持性的“拯救效应”尤为巨大。高归属感的环境像一张安全网,托住了这些在技术上自我怀疑的学生,给了他们继续尝试的勇气。相反,对于编程信心极高的学生,归属感的影响相对变小,他们更多依靠内在的效能感驱动。
这个发现极具政策含义:教学支持资源(如助教辅导、同伴互助小组)应当优先向低信心群体倾斜,为他们创造高归属感的“微观环境”,这可能是防止这部分人才流失性价比最高的方式。
4.4 不同群体间的差异
分组分析显示,女学生在初入AI领域时,其平均编程信心水平显著低于男学生,尽管她们的实际课程成绩并无差异。然而,一旦她们在环境中建立起较强的社会归属感,其信心增长速度和持久性表现会追上甚至反超。这凸显了为少数群体创建专属支持社区(如Women in ML/AI小组)的重要性。
非计算机背景(如数学、物理、生物)转来的学生,其社会归属感初始水平较低,普遍有“局外人”焦虑。但他们一旦突破最初的障碍,其编程信心的增长对持久性的边际效应更大。针对他们的入门课程,需要特别注重社区融入和“从零到一”的信心建立。
5. 从研究到实践:教育干预措施设计指南
研究的价值在于指导实践。基于以上发现,我们可以为AI/ML教育者、团队导师乃至学习者自己,设计出一套行之有效的干预“工具箱”。
5.1 系统性提升社会归属感的策略
归属感不能靠喊口号,需要嵌入到课程和社区设计的骨髓里。
1. 重构课程开场与叙事:
- 第一堂课不讲技术:用一节课的时间,邀请高年级学生或校友分享他们“挣扎与突破”的真实故事,重点强调“每个人都会遇到困难,这很正常,我们是一个共同学习的共同体”。这能迅速降低新生的“冒名顶替综合征”。
- 使用包容性语言:教师在课堂上避免使用“这个很简单”、“显而易见”等可能打击部分学生的表述。将挑战正常化,例如:“这个反向传播的推导是很多人的第一个难点,当年我也花了很久才搞懂,我们一步步来。”
2. 设计强制性的、结构化的积极互动:
- 固定学习小组:不要让学生自由组队,这容易导致边缘化。由教师或助教根据背景进行异质化分组(如计算机背景+非计算机背景),并赋予小组明确、互赖的任务角色(如“代码调试员”、“理论讲解员”、“文档整理员”)。
- 同伴互评与赞赏环节:在项目里程碑节点,不仅评代码,更设置“小组亮点发现”环节,要求每个小组找出并口头赞扬另一个小组设计中一个值得学习的点。这能构建积极的互赖关系。
3. 创建多层次的支持网络:
- 官方助教体系:确保助教不仅答疑,更承担“社区关怀”角色,定期主动与负责的学生小组进行非正式交流。
- 非官方朋辈导师:建立“学长学姐导师制”,一位高年级学生固定联系2-3位低年级学生,提供经验分享和心理支持。
- 线上社区建设:建立课程专属的Slack或Discord频道,设立不同板块(如#general-chat, #project-help, #career-talk),并由教师和助教积极参与,营造活跃、友好的线上氛围。
5.2 针对性构建编程信心的脚手架
信心来源于持续的成功体验。教学的核心是设计一条“可攀登”的阶梯。
1. 分解任务与即时反馈:
- 将大项目拆解为微型里程碑:一个“图像分类”项目,可以拆解为:数据加载→数据可视化→构建一个极简网络(如逻辑回归)→加入一层隐藏层→尝试CNN→调参优化。每个里程碑都设置明确的、可交付的小目标。
- 提供自动化的、形成性反馈:利用Jupyter Notebook或在线评测平台,为每个微型里程碑设计测试用例。学生提交代码后,能立刻得到“通过/未通过”以及具体的错误提示反馈,而不是等到几周后项目截止才从教师那里得到一个分数。
2. 将“挫折”正常化并工具化:
- 设立“经典Bug博物馆”:在课程Wiki上建立一个页面,专门收集和展示往年学生遇到的最常见、最棘手的Bug及其解决方案(如“维度不匹配:Expected input batch_size (64) to match target batch_size (32)”)。这传递了一个信息:遇到Bug是学习的一部分,而不是你能力不足的标志。
- 进行“调试实战演练”:专门拿出一节课,教师现场演示如何从一个模糊的错误信息开始,通过打印中间变量、查阅文档、使用调试器等方法,一步步定位并解决一个真实的Bug。这比讲任何理论都更能提升学生的调试信心。
3. 展示多元化的成功路径:
- 邀请背景多样的演讲者:不仅邀请顶尖研究员,也邀请那些从非CS背景转型成功的工程师、将AI应用于交叉领域(如金融、生物)的从业者来分享。这拓宽了学生对“在AI领域成功”的想象,减少了“我必须成为算法天才”的单一压力。
- 设立多元化的评价标准:在项目评分中,除了最终的模型精度,还应评估代码的整洁度、文档的清晰度、问题拆解的逻辑性、团队协作的表现等。让不同特长的学生都能找到展现自己价值的出口。
5.3 面向不同群体的精准支持方案
针对低信心群体:
- 提供“零基础起步”的额外辅导工作坊。
- 在分组时,确保他们与高支持性、高耐心的同伴或助教在一组。
- 给予更多“过程性表扬”,关注其努力和进步,而非仅仅结果。
针对非CS背景学生:
- 开设“CS先修知识速成”模块,重点补习数据结构、命令行操作等对CS学生是常识、对他们却是障碍的内容。
- 强调并利用他们的领域背景知识(如生物学生处理生物数据),将其转化为独特优势,提升其在小组中的价值感和话语权。
针对女学生等少数群体:
- 积极联系并宣传校内外相关的女性技术社区资源。
- 在课程材料、案例研究中,有意识地增加女性贡献者的介绍和女性角色的出现。
- 教师和助教需接受无意识偏见培训,确保在课堂互动、答疑中给予公平的机会和反馈。
6. 研究的局限与未来方向
没有任何研究是完美的,坦诚地认识到局限性,才能指明进步的方向。
首先,样本的代表性。我们的研究主要基于顶尖高校的学生,他们的整体学习资源和竞争环境可能与更广泛的高校有所不同。未来的研究需要在更多样化的院校中复制验证,特别是那些资源相对有限的学校,那里的社会归属感可能扮演着更关键的角色。
其次,测量方法的局限。我们主要依靠自陈式量表,这虽然高效,但可能受到社会赞许性偏差的影响(学生可能倾向于给出更“积极”的答案)。未来研究可以结合更多客观行为数据,如版本控制系统(Git)的提交频率和模式、在线学习平台的点击流数据、论坛发帖的情感分析等,构建更立体的“数字画像”。
第三,因果推断的挑战。尽管我们采用了纵向设计,但本质上仍是相关研究。更严格的随机对照实验是未来的方向。例如,可以随机将班级分为两组:实验组接受一套系统的“归属感-信心”提升课程干预,对照组接受常规教学,然后比较两组在持久性指标上的差异。
最后,文化因素的考量。本研究主要基于特定文化背景下的样本。社会归属感的表达和构建方式,在不同文化中可能存在差异。例如,集体主义文化和个人主义文化下的“归属感”内涵可能不同。进行跨文化比较研究,将能提炼出更具普适性的理论模型和实践指南。
7. 给AI/ML学习者的个人行动建议
抛开教育者的视角,作为一名正在或即将踏入这个领域的学习者,你可以从这项研究中汲取什么养分,来主动规划自己的学习路径,提升自己的“持久力”?
第一,主动构建你的“支持圈”,别单打独斗。认识到归属感不是被动等待获得的,而是可以主动经营的。开学第一周,就尝试去认识至少两位同学,组成一个固定的学习对子。主动加入课程的学习群,不要只潜水,尝试提出你的问题或回答别人的问题(哪怕是一个小问题)。寻找一位你欣赏的学长学姐或老师,定期进行非正式的交流。你的学习圈质量,很大程度上决定了你能走多远。
第二,重新定义“信心”,关注可积累的“小赢”。不要把编程信心看作一个固定的天赋。把它看作一个可以通过“成功体验”不断充值的账户。不要一上来就挑战最难的项目。为自己设定一系列“微小但确定”的胜利:今天成功配置了环境,明天理解了某个梯度下降的代码实现,后天独立修复了一个小bug。把这些“小赢”记录下来。当你感到沮丧时,回顾这个列表,它会告诉你,你的能力是在持续增长的。
第三,将“求助”技能化,而非污名化。很多学生因为怕被看不起而不敢提问。你需要升级你的求助策略。在提问前,确保你已经做了基础功课(如搜索了错误信息、检查了文档)。提问时,采用结构化表述:“我的目标是X,我尝试了Y方法,得到了Z结果或错误,这与我的预期不同,我猜测问题可能是A或B,这是我的相关代码片段和错误日志。” 这种高质量的求助,不仅能更快获得解答,本身也是专业能力的体现,更能让你从帮助者那里获得积极的反馈,从而增强你的社区归属感和信心。
第四,有意识地管理你的比较对象。在AI这个天才故事满天飞的领域,人们很容易陷入和顶尖高手比较的陷阱,从而产生持续的挫败感。你需要进行“社会比较重构”。多和“昨天的自己”比,关注进步;在社区中,不仅关注那些发布SOTA结果的大神,也去关注和欣赏那些分享失败经历、踏实解决具体问题的同行。理解到技术道路的多样性,找到适合自己的节奏和 niche(细分领域)。
这项研究最终揭示了一个核心道理:在机器学习与人工智能这条漫长而艰辛的学习道路上,决定你能走多远的,不仅仅是你的数学功底和代码能力,更是你与这个领域的情感联结,以及你内心深处那份“我能学会”的信念。打造一个支持性的环境,设计一条充满正反馈的学习路径,对于培养下一代AI人才而言,其重要性不亚于设计一门优秀的算法课程。
