当前位置：首页 > news >正文

大模型真的“理解”现实世界吗？研究表明它们确实理解

news 2026/6/12 5:05:16

来源：https://techxplore.com/news/2026-04-ai-language-real-world-basic.html

图片来源：Pixabay/CC0 公有领域

人工智能聊天机器人对世界的大部分认知，都是通过大量从互联网上获取文本——其中包含所有事实、谎言、知识和胡说八道。基于这些输入，人工智能语言模型是否有可能对现实世界有“理解”？事实证明，它们确实有——或者至少有某种理解。这是布朗大学研究人员一项新研究的结果，该研究将于4月25日星期六在巴西里约热内卢举行的国际学习表征会议上发表。该研究发布在arXiv预印本服务器上。

这项题为《这只是幻想吗？》的研究语言模型表示反映了人类对事件合理性的判断，深入探讨了多个人工智能语言模型的内部，寻找它们能够概念化事件与场景之间常见、不太可能、不可能甚至完全荒谬的迹象。

“这项工作揭示了一些证据，表明语言模型编码了类似现实世界的因果约束，”布朗大学博士生迈克尔·莱波里（Michael Lepori）说，他是该研究的领导者。“除了编码这些约束外，它们还以一种能够预测人类对这些类别判断的方式进行编码。”

Lepori的研究探讨计算机科学与人类认知的交叉点。他的指导来自计算机科学教授Ellie Pavlick和认知与心理科学教授Thomas Serre，两人均为布朗大学卡尼脑科学研究所的教员成员及研究共同作者。

在这项研究中，研究人员设计了一个实验，测试语言模型如何解释描述不同合理性事件的句子。有些陈述描述了常见场景：例如，“有人用冰块冷却了一杯饮料。”

有些情景不太可能或不太可能：“有人用雪冷却了一杯饮料。”

有些简直是不可能的：“有人用火冷却了一杯饮料。”有些说法荒谬：“有人用昨天来冷却饮料。”

对于每个输入，研究人员都分析了AI模型内生成的数学状态，这种方法被称为机制性可解释性。

“机械可解释性可以恰当地被描述为人工智能系统的神经科学，”Lepori 说。“它试图逆向工程模型在面对特定输入时的行为。你可以把它看作是理解机器'大脑状态'中编码的内容。”

通过比较来自不同类别的句子对生成的大脑状态差异——常见与不太可能、不太可能与不可能等——研究人员可以了解模型内部是否以及区分类别的程度。实验在多个不同的开源语言模型上重复进行，包括Open AI的GPT 2、Meta的Llama 3.2和谷歌的Gemma 2，以获得“模型无关”的概念，了解这些模型在类别间的区分能力。

研究发现，足够规模的模型确实会发展出与每个合理性类别高度相关的独特数学模式（向量）。这些向量甚至能以大约85%的准确率区分最相似的类别——如不可能事件与不可能事件。

此外，Lepori 表示，研究揭示的向量反映了人类对陈述可能属于哪类的不确定性。以“有人用帽子擦地板”为例。当人们听到这句话时，可能会对它代表不可能的事情或可能性存在分歧。在研究中，研究人员分析了这些向量，以了解人工智能系统对这些陈述的模糊性，并将其与人类参与者的调查结果进行比较。

“我们展示了模型实际上相当准确地捕捉了人类的不确定性，”莱波里说。“在比如说，50%的人认为某个陈述不可能，50%的人认为它不太可能发生的情况下，模型也赋予了大约50%的概率。”

综合来看，这些结果表明现代人工智能语言模型确实能够发展出反映人类理解的现实世界理解。研究发现，这些向量开始出现在参数数超过二十亿的模型中，而与当今超过万亿参数的模型相比，这个数量相当小。

更广泛地说，研究人员表示，这类机制性可解释性研究有助于更好地理解人工智能模型所知道的内容及其得知过程。研究人员表示，这将有助于开发更智能、更值得信赖的模型。

阅读最新前沿科技趋势报告，请访问21世纪关键技术研究院的“未来知识库”

未来知识库是“21世纪关键技术研究院”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告

（加入未来知识库，全部资料免费阅读和下载）