当前位置：首页 > news >正文

AI技术扩散六十年全景：从计算机科学到98%研究领域的渗透轨迹

news 2026/5/9 21:36:54

1. 项目概述：一次跨越六十年的AI技术扩散全景扫描

如果你和我一样，长期关注人工智能领域的发展，可能会有一个直观的感受：AI似乎无处不在。从实验室里的蛋白质结构预测，到社交媒体上的内容推荐，再到艺术创作中的风格迁移，这项技术正以前所未有的速度渗透到各个角落。但这种“感觉”究竟有多准确？AI的扩散是均匀的吗？它在不同学科中的渗透轨迹是怎样的？这些问题，单凭个人观察或零散的行业报告很难给出确切的答案。

最近，我和团队一起，利用文献计量学的方法，对过去六十多年（1960-2021年）全球范围内的学术出版物进行了一次大规模的“CT扫描”。我们分析了来自The Lens数据库的1.37亿篇同行评议文献，并采用了一个由经合组织专家工作组定义的、包含214个短语的AI关键词体系进行筛选。最终，我们锁定了超过310万篇与AI相关的论文。这项工作的核心目的，就是想用数据来回答一个根本性问题：作为一项通用目的技术，AI是如何从一个计算机科学领域的专有概念，演变成今天这种几乎席卷所有知识领域的现象的？这个过程是线性的吗？其中有哪些关键的转折点和模式？更重要的是，我们正处在AI发展的哪个阶段？是又一个短暂的“春天”，还是一次真正可持续的范式变革开端？

这次分析的结果，既在意料之中，又带来了不少惊喜。意料之中的是，AI的扩散确实广泛而深入。但数据揭示出的细节——比如其扩散的早期性、速度，以及在“AI之冬”期间依然坚韧的跨学科渗透——为我们理解当前这场技术浪潮的独特性提供了坚实的证据基础。无论你是身处计算机科学核心圈的研究者，还是正在思考如何将AI工具引入自己所在领域（可能是生物学、经济学甚至历史学）的实践者，理解这段技术扩散的历史全景，都能帮助你更好地定位自己工作的坐标，并更明智地规划未来的方向。

2. 研究方法与数据基石：如何为AI的扩散绘制地图

要绘制一幅精确的技术扩散地图，首先得解决两个核心问题：第一，数据从哪来，是否足够全面和可靠？第二，如何定义“AI”？这听起来简单，但在实际操作中，这两个问题恰恰是决定分析成败的关键。

2.1 数据源的选择：为什么是The Lens？

在文献计量分析中，常用的数据库有Scopus、Web of Science和Google Scholar等。我们最终选择了相对较新的The Lens数据库（版本8.2）。这个决定基于几个关键的实操考量。

首先，数据的广度与时间跨度。The Lens整合了微软学术图谱、CrossRef、PubMed、CORE等多个来源，收录了超过2.24亿篇学术出版物和1.37亿项专利，记录最早可追溯到1950年代。这对于我们追溯AI从1960年代（达特茅斯会议后不久）至今的完整发展轨迹至关重要。许多商业数据库在早期文献的收录上存在缺口，而The Lens的复合来源在一定程度上弥补了这一点。

其次，开放性与可操作性。The Lens采用非商业化的开放获取模式，这避免了商业数据库常见的访问限制和数据导出约束。更重要的是，它提供了功能完善的应用程序接口（API）。对于需要处理数千万乃至上亿条记录的宏观分析来说，通过Python脚本调用API进行自动化、定制化的数据检索与筛选，是唯一可行的路径。相比之下，Google Scholar缺乏公开API，手动检索在如此规模的分析中根本不现实。

实操心得：在进行大规模文献计量分析时，API的可用性是选型的第一道门槛。没有API，意味着你无法进行可重复、可验证的批量数据处理。The Lens的API文档清晰，查询逻辑灵活，支持基于出版年份、文献类型、学科分类等多维度的复杂筛选，这为我们后续的精细分析打下了坚实基础。

2.2 定义AI：一个包容且可操作的框架

“人工智能”是一个边界模糊、不断演进的概念。如果定义过窄（比如只搜索“机器学习”或“深度学习”），会严重低估AI在早期或其他子领域的影响；如果定义过宽，又会引入大量噪音。我们采用了经合组织（OECD）专家工作组制定的一份包含214个短语的列表。这份列表的生成过程本身就很严谨：它基于对Scopus数据库中已归类为AI的文献进行文本挖掘和专家验证，涵盖了从“专家系统”、“启发式搜索”到“计算机视觉”、“自然语言处理”等几乎所有的AI子领域。

为了验证其有效性，我们将其与另一项常用研究中的关键词列表进行了对比。结果发现，OECD列表中有113个短语在另一列表中完全找不到对应项，这主要归因于OECD列表包含了“模式识别”等更细分、但在AI研究史上占比很大的领域。采用一个更包容的定义，是为了捕捉AI作为一门学科其外延的完整演变，而不仅仅是追踪当前的热点。在我们的筛选中，一篇文献只要在标题、摘要或关键词中包含了这214个短语中的任何一个，即被认定为AI相关文献。

2.3 学科分类体系：ASJC的粒度优势

为了观察AI在不同领域的渗透，我们需要一个统一的学科分类标准。我们采用了爱思唯尔的“全科学期刊分类”（ASJC）体系。这个体系分为三级，最细粒度包含了333个独立的研究领域，它们被归类到26个二级学科，进而归属于物理科学、生命科学、健康科学、社会科学以及艺术与人文这五大科学领域。

ASJC的优势在于其粒度细、覆盖广。它允许我们不仅看到AI在“工程学”这样的大类中的增长，还能深入到“化学工程”、“材料科学”甚至“牙科学”这样的具体领域去观察变化。The Lens数据库中的每篇文献都通过其ISSN号关联了一个或多个ASJC三级分类代码，这为我们进行跨学科的精确统计提供了可能。

数据处理流程可以概括为以下几步：

数据获取：通过The Lens API，抓取1960-2021年间所有文献类型为同行评议书籍、书籍章节、期刊文章和会议论文/会议录的记录。
初步筛选：从最初的2.24亿条记录中，剔除不符合上述文献类型的记录，得到约1.37亿篇有效学术文献。
AI文献识别：在这1.37亿篇文献的标题、摘要和关键词中，扫描匹配214个OECD AI短语。
学科归类：将匹配成功的AI文献（最终约312.6万篇）与其ASJC学科分类进行关联。
指标计算：按年份、按学科计算AI相关出版物的数量、占比（强度）以及分布的均匀度（基尼系数）。

这个过程听起来直接，但在处理海量数据时，对计算资源和数据清洗的要求极高。例如，需要处理同一文献被重复计数（因属于多个学科）的情况，并确保时间序列数据在不同年份间的可比性。

3. 核心发现：AI扩散的轨迹、模式与当前态势

当海量数据经过上述流程的处理后，AI跨越半个多世纪的扩散图景便清晰地呈现出来。这些发现不仅量化了我们的直觉，更揭示了一些反直觉的深层模式。

3.1 扩散轨迹：早期、快速且广泛

最令人印象深刻的发现是AI扩散的速度与广度。1960年，在全部的333个研究领域中，只有48个（14%）有AI相关的出版物发表，这些领域主要集中在计算机科学、工程学和决策科学。然而，扩散随即开始：

1972年：超过一半（>50%）的研究领域已出现AI相关研究。
1986年：这一比例超过了80%。
当前（2021年）：超过98%的研究领域都有了AI的踪迹。

这意味着，AI在诞生后不到二十年，其思想和方法就已经传播到了大多数科学领域。这种早期的、爆炸式的跨学科扩散，远超许多人的想象。它表明，AI作为一种解决问题的“思维工具”或“方法工具箱”，其潜力很早就被不同领域的先驱者所识别和尝试。

3.2 渗透深度：从“星星之火”到“广泛燎原”

我们使用“AI出版强度”（即某个领域内AI相关出版物占该领域总出版物的百分比）来衡量AI在不同学科中的渗透深度。整体来看，AI出版强度从1960年的微不足道（0.02%），缓慢增长到1995年才接近1%。然而，真正的转折点出现在最近几年：

2017年：整体强度达到约3%。
2021年：在短短五年内跃升至5.3%。

更惊人的是，过去五年（2017-2021）发表的AI相关论文数量，超过了之前57年的总和。AI出版物的年均增长率在过去五年高达26%，而在此之前的历史平均增长率为17%。这清晰地表明，我们正处在一个前所未有的加速增长期。

3.3 学科差异：谁在引领，谁在追赶？

尽管扩散广泛，但不同学科对AI的接纳程度和节奏差异显著。通过分析二级学科的数据，我们可以看到清晰的梯队：

引领者（计算机科学）：始终是AI研究的绝对核心。2021年，计算机科学领域内超过四分之一的出版物（25.7%）与AI相关，其强度和总量都遥遥领先。
深度应用者（工程、数学、决策科学）：这些与计算和逻辑紧密相关的领域是AI的早期和深度使用者。到2021年，工程学（11.3%）、数学（14.1%）和决策科学（11.3%）的AI出版强度均已超过10%。
快速崛起者（物理、化学、材料科学）：近年来增长迅猛。例如，物理学与天文学的AI强度从2015年的1.7%飙升至2021年的7.0%。这得益于AI在粒子物理数据分析、计算化学、新材料发现等方面的强大能力。
新兴融合者（生命科学、社会科学、艺术人文）：虽然起点低，但近期增速惊人。例如，艺术与人文领域的AI强度从2015年的0.7%增长到2021年的3.2%，增长了近4.6倍；经济学与计量经济学从1.1%增长到3.5%；牙科学更是从0.3%跃升至1.7%。这显示了AI正在解决越来越多样化、甚至带有主观性和创造性的问题。

3.4 集中度变化：从聚集到相对均衡的扩散

我们使用经济学中衡量收入不平等程度的基尼系数，来量化AI出版物在不同研究领域间分布的均匀程度。系数为0表示完全平均分布，为1表示完全集中于一个领域。

1960年：基尼系数高达0.91，表明AI研究高度集中于计算机科学等极少数领域。
1980年：系数迅速下降至0.72。
1980年至今：系数稳定在0.71-0.76的区间。

这个变化趋势非常说明问题：在1970-1980年代，AI实现了从高度集中到相对分散的快速扩散。然而，此后系数并未继续大幅下降，而是保持稳定。这是因为，尽管AI扩散到了几乎所有领域，但计算机科学本领域的AI研究产出在以更快的速度增长，维持了其在总体中的较大份额。这描绘出一幅“核心持续壮大，外围广泛渗透”的动态图景。

数据解读要点：基尼系数的稳定并不意味着扩散停滞。相反，它反映的是一种“水涨船高”的态势。核心领域的爆发式增长，与外围领域的普遍应用，共同推动了AI研究总量的膨胀。理解这一点，有助于我们避免低估AI在非计算机领域的影响力。

4. 驱动因素与历史周期：为何此次“AI之春”与众不同？

面对当前AI研究的爆炸式增长，一个自然的问题是：这次会不会又是一场泡沫？历史上有过“AI之春”和“AI之冬”的循环，这次有何不同？我们的数据分析，结合对技术生态的观察，指向了几个关键的结构性变化。

4.1 核心驱动力：工具民主化与算力普惠

近期AI加速扩散的最直接驱动力，是工具链的成熟与易用性革命。2010年代中期以来，一系列开源机器学习框架的涌现，极大地降低了AI的应用门槛：

Scikit-learn：为传统机器学习提供了清晰、一致的API，让研究人员无需深究算法实现细节即可应用。
TensorFlow和PyTorch：这两大深度学习框架的竞争，推动了动态图、更友好的API设计，使得构建复杂神经网络变得像搭积木一样直观。特别是PyTorch，因其Pythonic的设计和优秀的调试体验，深受学术界欢迎。
预训练模型与模型库：Hugging Face等平台提供了海量的预训练模型（如BERT, GPT系列），研究人员可以在自己的领域数据上进行微调，而无需从头训练，这节省了巨大的时间和算力成本。
云平台与自动化工具：AWS、GCP、Azure等云服务提供了即用的GPU算力和机器学习服务。AutoML等自动化工具甚至尝试将模型选择和调参过程也自动化。

这些工具的共同特点是，它们将AI工程师从繁琐的底层编码和系统调优中解放出来，让领域专家（生物学家、医生、社会学家）能够更专注于问题本身和数据的准备。AI从一个需要深厚计算机科学背景才能驾驭的“黑魔法”，变成了各学科研究生通过几周培训就能上手使用的“高级计算器”。

4.2 算力与数据的双重红利

除了软件，硬件和数据的进步同样不可或缺：

GPU与专用芯片：图形处理器（GPU）以及后续的TPU、NPU等专用AI芯片，为矩阵运算提供了前所未有的并行计算能力，使得训练大型深度学习模型从“不可能”变为“可行且经济”。
数据爆炸：互联网、物联网、高通量实验设备产生了海量数据。AI，特别是深度学习，是一种“数据饥渴”型技术，更多的数据通常意味着更好的模型性能。各学科自身产生的数据，为AI的应用提供了燃料。
开源文化与协作：GitHub等平台促进了代码和模型的共享，形成了强大的社区生态。一个在计算机视觉领域有效的模型架构，很快就会被尝试应用于医学影像分析或天文图像处理。

4.3 穿越历史的视角：本次“春天”的韧性

历史上，AI经历过两次主要的“春天”与“冬天”循环。第一次春天（1956-1974）因对逻辑推理和通用问题求解的过高期望遇挫而结束；第二次春天（1981-1987）则随着专家系统商业化的困难而降温。两次“冬天”的共同根源是技术未能兑现被炒作放大的承诺，导致资金和兴趣骤减。

那么，当前的情况是否在重蹈覆辙？我们的数据和分析认为，有理由保持乐观：

规模与广度不可同日而语：当前的AI出版强度和总量远超历史任何时期，且渗透到了98%的研究领域。这意味着AI已经建立了广泛而深厚的应用基础，其价值在无数个具体的、细分的科研问题中得到验证，而非依赖于几个宏大的、未实现的承诺。
技术栈的成熟度：历史上的AI之春缺乏像今天这样成熟、易用、开源且社区支持强大的工具链。当前的技术生态更健壮，抗风险能力更强。
明确的商业与社会价值闭环：AI不仅在学术界爆发，在产业界的应用也形成了清晰的商业价值（如推荐系统、自动驾驶、药物研发），这为社会资源的持续投入提供了强劲动力，与之前主要依赖政府和机构科研经费的模式有本质区别。
从“模仿智能”到“增强智能”的范式转变：早期的AI目标多是创造“通用人工智能”（AGI）以替代人类。而当前的主流应用更多是“狭义人工智能”（ANI），旨在作为工具增强人类在特定任务上的能力（如数据分析、模式识别、预测）。这个目标更现实，也更容易在短期内看到成效。

因此，尽管局部调整和期望管理不可避免，但类似历史上那种全局性的、长期的“AI之冬”再次发生的可能性已经大大降低。当前的浪潮有着更坚实的技术基础、更广泛的应用锚点和更可持续的经济生态。

5. 跨学科应用的实践路径与挑战

看到AI在各个领域的高增长数据令人兴奋，但对于具体领域的学者或从业者而言，更关心的问题是：“我该如何在我的领域里开始应用AI？”以及“我会遇到哪些坑？”基于对大量跨学科研究案例的观察，我们可以梳理出一些通用的实践路径和必须警惕的挑战。

5.1 典型应用路径：从辅助工具到研究范式

AI进入一个传统领域，通常遵循一个渐进式的路径：

阶段一：自动化与效率提升（“更好的工具”）这是最常见的起点。研究者利用AI完成那些重复、繁琐但规则相对明确的任务。

案例：在生物医学中，用图像识别算法自动计数细胞或分析组织切片；在社会科学中，用自然语言处理技术批量分析访谈文本或历史档案；在化学领域，用机器学习预测分子性质，加速初步筛选。
技术栈：通常使用现成的工具包（如OpenCV用于图像处理，NLTK/spaCy用于文本处理）或调用云API。对领域专家的AI技能要求相对较低，重点在于问题定义和数据准备。

阶段二：发现新关联与模式（“新的显微镜”）当数据积累到一定规模，AI开始帮助研究者发现人眼或传统统计方法难以察觉的复杂模式。

案例：在天文学中，利用机器学习从海量巡天数据中识别新的天体或异常现象；在生态学中，通过分析传感器和图像数据，建立物种分布与环境因子间更复杂的非线性模型；在金融学中，用深度学习模型捕捉市场微观结构中的非线性特征。
技术栈：需要更定制化的特征工程和模型选择，可能涉及传统的机器学习方法（如随机森林、梯度提升树）以及简单的神经网络。开始需要一定的AI专业知识，或与数据科学家进行紧密合作。

阶段三：驱动假设生成与颠覆性发现（“研究伙伴”）这是AI应用的深层阶段，模型不仅分析数据，甚至能提出新的、可检验的科学假设，或直接产生新的解决方案。

案例：DeepMind的AlphaFold2破解蛋白质结构预测难题；AI设计新型电池材料或药物分子；在理论物理学中，AI帮助发现数据背后的简洁数学公式（符号回归）。
技术栈：涉及最前沿的深度学习、强化学习、生成式模型等。通常需要高度跨学科的团队，领域专家与AI研究员深度耦合，共同设计模型架构和训练目标。

实操建议：对于大多数领域研究者，不必强求一步到位到“阶段三”。从“阶段一”入手，解决一个具体的、影响科研效率的“痛点”问题，是成功率最高、获得感最强的路径。例如，一个考古学家可以先尝试用开源工具对陶器碎片图像进行自动分类，积累经验和数据后，再探索更复杂的应用。

5.2 核心挑战与避坑指南

跨学科应用AI的道路并非坦途，以下几个挑战尤为突出：

1. 数据之困：质量、偏见与可得性

问题：AI模型“垃圾进，垃圾出”。许多学科的数据存在标注成本高、样本量小、噪声大、存在系统性偏见（如临床数据多来自特定人群）等问题。
避坑指南：
- 数据审计先行：在建模前，花大力气进行数据清洗和探索性分析。理解数据的分布、缺失模式和潜在偏见。
- 重视数据标注规范：制定清晰、一致的标注规则，并进行多人交叉验证，确保标注质量。对于小样本问题，主动学习、数据增强、迁移学习等技术是值得尝试的策略。
- 警惕“历史偏见”：如果训练数据反映了历史上的不公或偏见（如某些人群在医疗诊断中被低估），模型会学习并放大这些偏见。必须在项目初期就考虑公平性评估和缓解措施。

2. “黑箱”难题：可解释性与信任

问题：复杂的深度学习模型如同黑箱，其决策逻辑难以理解。这在医疗诊断、司法辅助等高风险领域是致命伤，也阻碍了研究者从模型中发现新的科学洞见。
避坑指南：
- 从可解释模型开始：在追求性能前，优先考虑线性模型、决策树等可解释性强的模型。即使最终使用复杂模型，也可将其作为基准。
- 善用解释性工具：利用LIME、SHAP等工具对复杂模型的预测进行事后解释，理解哪些输入特征对输出影响最大。
- 领域知识嵌入：尝试将领域知识（如物理定律、生物学约束）构建到模型架构或损失函数中，发展“物理信息神经网络”或“知识图谱嵌入”等方法，这不仅能提升模型性能，也能增强其可解释性和可靠性。

3. 评估陷阱：过拟合与泛化失败

问题：在有限的、特定的数据集上表现优异的模型，在真实世界或其他场景中可能完全失效。这在COVID-19诊断AI的研究中暴露无遗，许多早期模型因方法学缺陷或数据偏见而无法用于临床。
避坑指南：
- 严格的评估协议：坚决使用独立的测试集，并采用交叉验证。避免任何形式的数据泄露。
- 超越准确率：根据领域特点选择合适的评估指标。在医学中关注敏感性和特异性；在不平衡数据中关注F1分数或AUC-ROC。
- 外部验证：尽可能寻找外部数据集来验证模型的泛化能力。如果条件不允许，至少要在内部数据上模拟不同的分布场景进行压力测试。

4. 人才与协作壁垒

问题：领域专家不懂AI，AI专家不懂领域。双方沟通困难，导致项目目标错位，AI解决方案不切实际或无法解决核心科学问题。
避坑指南：
- 培养“双语”人才：鼓励领域内的研究生或青年学者学习基础的AI和数据分析技能。他们将成为沟通的桥梁。
- 深度协作，而非简单外包：建立真正的跨学科团队，从问题定义阶段就共同参与。定期召开联合研讨会，AI专家讲解模型原理和局限，领域专家阐释问题背景和数据含义。
- 设定务实的目标：从“用AI提升XX环节效率10%”这样具体、可衡量的目标开始，而不是“用AI革新整个领域”这样的模糊愿景。

6. 未来展望：从效率工具到科学发现的“新引擎”

基于过去六十年的扩散轨迹和当前的技术生态，我们可以对AI在未来科学研究中的角色做出一些有根据的展望。它很可能沿着两个维度深化其影响：一是作为“生产力工具”的普及，二是作为“科学方法本身”的演进。

6.1 普及化：AI成为科研的“默认配置”

未来，使用AI工具进行数据分析、文献挖掘、实验设计优化，可能会像今天使用统计软件或搜索引擎一样，成为绝大多数科研人员的基础技能。这将带来几个变化：

教育体系的变革：统计学、编程和机器学习基础将成为本科乃至研究生通识教育的一部分，而不仅仅是计算机专业的课程。
科研流程的重塑：从假设生成、实验设计、数据采集到结果分析的全链条，都将有AI辅助工具的嵌入，形成“人机协同”的新工作流。
研究门槛的降低与提升并存：一方面，成熟工具让更多人能应用AI；另一方面，要想做出突破性工作，对问题本质的理解和跨领域整合能力的要求会更高，竞争将在更高维度展开。

6.2 深化：AI驱动范式级别的科学发现

更具颠覆性的前景是，AI可能从辅助工具演变为科学发现的核心引擎。这体现在：

自主科学发现系统：类似“诺贝尔图灵挑战”所设想的，高度自主的AI系统能够自主阅读文献、提出假设、设计并执行计算或实体实验、分析结果并修正理论。这并非取代科学家，而是作为超级研究助理，极大扩展人类认知的边界。
复杂系统的模拟与理解：在气候科学、计算社会学、宏观经济学等领域，AI可以帮助构建和模拟极度复杂的系统，探索在传统数学模型下难以推演的非线性动态和涌现现象。
“反绎”推理的新模式：传统的科学方法是“归纳”（从数据到理论）和“演绎”（从理论到预测）。AI，特别是生成式模型，可能催生一种新的“反绎”模式——从观察到的现象和数据中，直接生成可解释的模型或理论框架，加速从数据到知识的转化。

6.3 可持续增长的隐忧与前提

尽管前景乐观，但可持续增长并非没有隐忧。除了前文提到的技术挑战，还有两个系统性问题需要关注：

科研生产力的“索洛悖论”：即AI的广泛应用是否一定能转化为可测量的科研产出（如重大突破性论文）的增长？初期可能存在适应期，大量投入仅带来效率提升而非范式突破。衡量AI对科研的真正贡献，需要更精细的指标，而非仅仅论文数量。
基础设施与资源公平：高性能计算资源、高质量数据集和AI人才的分布并不均衡，可能加剧科研领域的“马太效应”，使资源丰富的机构强者恒强。推动开源模型、公共算力平台和数据集共享，对于维持健康、包容的AI科研生态至关重要。

回顾这六十多年的数据，AI的扩散故事是一个从“计算智能”到“渗透性赋能”的演变。它不再是一个独立的学科分支，而是演变为一种弥散在几乎所有知识生产过程中的“元方法”。对于身处任何领域的研究者和实践者而言，重要的或许不再是争论AI会不会影响自己，而是如何主动地、批判性地理解和运用它，将其转化为探索未知、解决实际问题的强大助力。这场由数据和算法驱动的科学方法演进，其序幕刚刚拉开，而我们都将是其中的参与者和塑造者。

查看全文

http://www.jsqmd.com/news/785394/