当前位置: 首页 > news >正文

人工智能在科学领域需要设立防护措施,避免对它不加批判地采用

耶鲁大学人类学研究生院主任Lisa Messeri、和普林斯顿大学的心理学家M. J. Crockett 发给《自然》期刊的论文中阐述:人工智能正在迅速加速科学产出,但也有可能缩小研究范围,削弱判断力,削弱科学家的培训方式。

科学界正以惊人的速度采用人工智能工具,尤其是大型语言模型(LLM)。过去三年,LLM辅助论文写作大幅增长,研究人员也试图将半自主智能体纳入他们的工作流程。然而,人工智能在科学领域的快速且不加批判的采用也带来了重大风险。几个问题已经显现:使用人工智能工具的论文关注的是更狭窄的研究问题在某些情况下,科学价值被评估较低4而非依赖人工智能的研究则更为重要。

为什么过度依赖人工智能驱动的建模对科学有害

此外,随着人工智能自动化日常科学任务,早期职业研究人员培训机会流失的担忧大多未被解决,且常常未被承认。传统上,科学培训将事实和方法的正式教学与通过动手入门级工作逐步获得隐性知识相结合。科学与技术研究领域的学者多次证明,仅靠科学文本并不能完全传达知识;相反,关键的知识深植于研究社区,并通过学徒制和实践传递。

这种默契——例如,什么是“合理”数据,或难以在方法部分表达的技术细节,或结果是否与现有文献一致——对于研究者未来有效监督AI辅助工作流程至关重要。如果人工智能系统越来越多地取代入门级科学劳动力,学员可能永远无法掌握这些技能,可能导致下一代科学家无法负责任地监督人工智能驱动的研究。

这些趋势要求科学家正视科学机构的宗旨。人们的目标仅仅是建立科学事实的集合,还是培养一个活生生、不断发展的科学知识者社区?如果人工智能工具加速了前者的目标,同时威胁到了后者,科学家们应如何前进?借助关于人工智能对科学实践影响的新兴证据,提出重点介绍主要风险并概述潜在的解决方案。

人工智能行业积极向科学家推销LLM产品,视其为提高生产力的技术。一些研究人员接受了这一承诺,称赞这些产品能够“强化”他们的学术写作能力。

人工智能是否导致科学中的可重复性危机?

如果人们将生产力理解为科学论文的产出,人工智能产品无疑兑现了这一承诺,并产生了深远的影响。

除了生产力提升,有证据表明,使用人工智能工具的科学家获得的引用次数更多,晋升为首席研究员的速度也比未使用者更快以英语为母语的人受益尤为明显。

值得注意的是,人工智能产品的职业优势最明显体现在数量指标上,如发表次数和引用次数。这些措施无法解释这些利益是源于科学贡献,还是源于与某个炒作领域的联系。因此,若将这些指标视为科学的胜利,而忽视了生产力提升的质量,将是错误的。

越多不一定越好,而且越来越多的证据表明,大型语言模型推动的科学生产力提升往往是有代价的。最明显的是“人工智能垃圾”被引入文献,包括无意义的人工智能生成图像和幻觉引用。

多项研究记录了大量依赖LLM辅助写作的论文出现令人担忧的趋势。《科学组织》杂志审核了2021年1月至2026年1月期间收到的全部6,957篇投稿,并指出LLM辅助论文的科学质量较低(以期刊接受这些作品的可能性衡量)。另一项研究从2024年人工智能会议收集的264,125篇论文中,以及2023-24年在三个预印本服务器(arXiv、bioRxiv和SSRN)上发布的投稿中,发现在LLM辅助论文中,良好的写作不再是科学质量的准确启发式(以发表结果和同行评审评分衡量)。

人工智能能有常识吗?

了解这些信息将是实现机器智能的关键,这对科学事业造成了“风险,因为大量表面上令人信服但科学上令人失望的研究可能会淹没文献”。目前,尽管大家一致认为这些污染不应该发生,但目前尚无明确的解决方案来应对这些污染。

在研究流程中实施的人工智能工具也在以更微妙的方式限制科学理解,例如缩小了研究人员关注的范围。分析在涵盖生物学、医学、化学、物理学、材料科学和地质学的4130万篇研究论文中,研究表明人工智能的采用似乎“促使作者趋向于解决已知问题的相同方案,而非创造新问题”。这预示了人工智能可能对知识生态系统产生连锁反应的可能性。

人工智能在科学领域的最宏大愿景涉及半自主或完全自主的“人工智能科学家”,这一愿景的最新原型在科学界和业界都获得了高度赞誉。人工智能科学家的开发者们总是迅速安慰说,他们的意图“不是取代人类科学家,而是增强和加速他们的工作”。因此,这些产品应由一位技术娴熟的科学家监督,能够负责任地指导和检查人工智能的输出。

专家质疑,如果没有清晰阐述负责任科学家如何培养区分好坏AI结果的专业知识,这一愿景是否能够实现。

http://www.jsqmd.com/news/861779/

相关文章:

  • Vivado 全局启动脚本 (Vivado_init.tcl) 极简配置教程
  • Cloud-Device Collaborative Learning for Multimodal Large Language Models
  • 非遗传承匠心打造--河南厚道中医药有限公司
  • 第22章 组织通用治理
  • 2026PCB板测厚传感器技术解析:透明物体测厚传感器、非接触式传感器、高精度激光位移传感器、高精度激光测距仪选择指南 - 优质品牌商家
  • Promptfoo的搭建与测试,2026-0521成功版很简单
  • Onekey Steam清单下载工具:3步搞定游戏清单管理的终极指南
  • 微商城做的比较好的有哪些服务商?来抄作业啦!
  • 基于Java Web的学生信息智能管理系统的设计与实现
  • 基于模型预测控制的波浪能转换器(WEC)研究(Matlab代码实现)
  • 《元创力》纪实录·桥段异步纪元:当“等待”成为文明的第一课
  • 记一组无人机IMU传感器数据
  • 进口与国产扁线电感参数PK:Coilcraft SER2918H-103KL vs TONEVEE ZER2918-H103K
  • Sa-Token客户端ID校验失败的原理与修复指南
  • UE5 BaseEngine.ini 配置源码级解析:从.ini文件到运行时架构
  • 从腾讯 Marvis 看 MateClaw:企业级 Agent Harness OS 应该怎么落地
  • 2026年5月钛蒸发循环泵品牌排行:自吸污水泵、自吸离心泵、蒸发强制循环泵、蒸发混流泵、蒸发结晶循环泵、蒸发轴流泵选择指南 - 优质品牌商家
  • Unity编辑器性能优化:工作流、场景与预制体三大资源创建瓶颈
  • 干翻特斯拉?雷军说输给特斯拉不丢人
  • 基于魔珐星云打造的AI女友数字人:甜美陪伴、秒回消息、语音随时交互
  • AI人工智能行业的未来:AI将如何改变我们的生活和工作
  • UE5 BaseEngine.ini深度解析:引擎启动固件与配置原理
  • 【Kafka笔记】(三)常用命令整理
  • Sa-Token客户端ID不匹配报错的根因与修复指南
  • Unity编辑器资源创建性能优化:从Prefab到场景的序列化治理
  • OpenSSH 9.6P1升级实战:修复CVE-2023-51385内存越界漏洞
  • 12个优质播客音乐素材网站,解决你缺BGM的烦恼
  • SoapUI SOAP测试实战:WSDL解析、断言调试与Mock服务配置
  • UE5 BaseEditorSettings.ini 源码级解析与配置优先级链
  • Unity Addressable热更新深度整合实战指南