当前位置：首页 > news >正文

从训诂学到人工智能：一场两千年的相关性困局，与因果性的破局时刻

news 2026/6/20 2:05:18

本文试图点明历次争论中被长期忽略的核心事实：训诂学之所以长期背负“唯心主义”“伪科学”的质疑，争论两千年仍无统一评判标准，更被很多人视作“无用之学”，根源从来不是传世文献或文字材料有问题，而是研究方法始终没有突破“相关性归纳”的固有局限。

一、训诂被斥“伪科学”，问题出在哪？

在公共讨论平台搜索“训诂学”，总能看到两种极端对立的观点：

①一方认为：训诂是中国传统文化的精髓，是最严谨的传统学问；

②另一方则认为：训诂是彻头彻尾的伪科学，全凭主观臆断的文字游戏。

双方争了十余年，谁也说服不了谁，但其实两种看法都有其依据。

①说训诂严谨并非过誉：乾嘉学派的学者用三百年皓首穷经，把每一个汉字的读音、字形、义项梳理考证得详实周密，其严谨程度甚至超过今天很多领域的研究者。

②说训诂是“伪科学”也并非苛责：直到今天，训诂研究仍没有普适的客观评判标准——两个字算不算同源词？一个字的本义究竟是什么？缺乏普适的、可量化的客观评判标准，难以通过可重复的实验或形式化推导进行统一验证，最终的结论往往更多依赖研究者的学术积累与行业共识。

对于任何一门学科而言，如果结论难以被证伪，很大程度上依赖学术权威的判断，在大众眼中自然和“伪科学”没有本质区别。

而训诂学之所以陷入这般境地，核心原因只有一个：它的所有论断，本质上都是相关性的归纳，而非必然性、因果性的演绎。

要特别说明的是：这种争议并非当代人的首创，早在近代西学东渐时期，西方实证科学范式传入中国，传统“小学”（训诂、文字、音韵）因为没有可重复、可证伪的实验验证体系，就曾被当时学者指出存在“主观随意性”问题，后来更一度被贴上“唯心主义”的标签，至今的公众争议其实是百年学术范式冲突的延续。

二、训诂研究的三重相关性陷阱

训诂学发展两千年，先后诞生过三种主流研究方法，但其内核始终没有跳出“寻找相关性”的逻辑：

（一）民间解字学：字形相关性

这是最基础也最受学界批判的相关性逻辑。看到“船”字是“舟加八口”，就完全脱离汉字演变历史，附会诺亚方舟上正好有八个人。

这种研究的逻辑是“字形长得像，含义就相通”，问题非常明显：太过主观随意，任何一个字都可以强行拆成几个部件，编出一套自圆其说的解释，这也是这类民间解字法常被诟病为“民科”的核心原因。

（二）传统训诂学：语音相关性

这是专业训诂研究的核心方法，也是乾嘉学派最重要的学术贡献。乾嘉学者发现，很多读音相近的字，含义也相近，因此提出“音近义通”的原则，主张“就古音以求古义，引申触类，不限形体”。这是训诂学的巨大进步，突破了字形的束缚，把训诂从拆字游戏提升到了系统研究的高度。

但它本质上仍然是“相关性”判断：“读音相近所以同源”，只回答了“是什么”，没有回答“为什么”。为什么读音相近的字含义会相通？为什么有些读音相近的字含义完全无关？有没有规律可以预判哪两个字必然同源？这些问题至今没有答案。所以才会出现同用“音近义通”的原则，甲说A和B同源，乙说A和C同源，丙说前两者都错，A和D才是同源，最终各执一词，不了了之。

（三）现代训诂学：文献相关性

这是当代训诂研究最常用的方法：学者借助计算机统计两个字在所有传世古籍中的出现频率，如果两者经常共同出现，或者可以互相替代，就判定它们含义相近。

这种方法借助了算力工具，看起来非常科学，但本质上仍然是相关性判断：“共同出现所以含义相近”，逻辑和今天的大模型完全一致——大模型也是通过统计词汇的共现频率，判断语义关联。而大模型的所有缺陷，现代训诂学也都具备：只能看到表面关联，看不到背后的因果逻辑；只能事后解释现象，不能事前预判规律；还常常出现“幻觉”，把偶然的相关当成必然的联系。

三、相关性无法替代因果性

这是问题的核心，也是绝大多数训诂研究者终身没有突破的认知局限。

①什么是相关性？是“我观察到A总是和B共同出现（所以相关性有时也可以成为共现性）”；

②什么是因果性？是“因为A的存在，所以必然导致B的发生”。

①相关性只能说明“是什么”；

②因果性才能解释“为什么”。

①相关性只能做事后的补充解释；

②因果性才能做事前的规律预判。

①相关性的结论可以被质疑；

②因果性的规律才是经得住验证的真理。

①张衡之前，所有人都看到月食会定期发生，这是相关性；

②张衡提出“月食者，地影蔽之”，解释了月食的成因，这才是因果性。

①牛顿之前，所有人都看到苹果会落到地上，这是相关性；

②牛顿提出万有引力定律，解释了苹果落地的底层逻辑，这才是因果性。

①达尔文之前，所有人都看到不同物种之间有相似性，这是相关性；

②达尔文提出进化论，解释了物种相似的根源，这才是因果性。

①门捷列夫之前，所有人都知道不同元素有不同的性质，这是相关性；

②门捷列夫整理出元素周期表，解释了元素性质周期性变化的规律，这才是因果性。

而训诂学在两千年的发展中，始终停留在“观察到相似性”的阶段：

①民间学者看到字形相似就说含义相通；

②传统学者看到语音相似就判定为同源；

③现代学者看到文献共现就说含义相近。

截至目前，绝大多数研究都没有真正解释过“为什么会有这些相似性”，也没有建立起一套因果贯通的理论体系。

这就是训诂学争论两千年仍无定论的根源，是它始终摆脱不了“唯心”“伪科学”质疑的原因，也是大众觉得它“无用”的核心理由。

要特别说明的是：相关性本身是科学研究的必经阶段，训诂学两千年积累的海量相关性成果绝非无效劳动，恰恰是后续建立因果性体系的必要前提——没有足够的现象观察、规律归纳，因果性的提炼就成了无源之水。我们指出训诂的相关性困局，绝非否定历代学者的贡献，而是希望在现有积累上再向前推进一步。

四、黄易青先生的探索

历代训诂学者中，黄易青先生真正意识到了这个核心问题。他的《上古汉语同源词意义系统研究》，是训诂史上第一次尝试建立因果性意义体系的探索：他不再满足于零散考证单组同源词，而是试图把所有同源词纳入一个统一的系统，寻找它们之间内在的、必然的联系。

他已经摸到了因果性研究的门槛，证明了同源词不是零散的个体，而是一个有机的整体，彼此的联系不是偶然的，而是有规律可循的。

但可惜的是，他没能跨出最后一步：

①他找到了系统的整体结构，却没有提炼出驱动这个系统运行的第一性原理，也没有构建出可形式化的语义本体论；

（注：第一性原理与本体论本质上指向同一目标——揭示领域最根本的结构。区别在于：第一性原理是演绎推导的逻辑起点，本体论是这一结构的形式化表达。二者结合，就是将人类语义认知的底层逻辑，构建为一套可计算、可验证的理论体系。）

②他证明了音义之间存在必然联系，却没有解释为什么会存在这种联系；

③他的系统是从大量同源词中归纳出来的，而非从第一性原理演绎推导出来的。

而绝大多数训诂学者，甚至还达不到黄易青先生的研究高度：

①他们仍然用传统的相关性思维做研究，仍然用相关性的标准去批判其他研究者。

②部分学者把“批判民科”当成了学术本身，却没有意识到，自己脚下的学术地基，和他们批判的对象一样，都是建立在流沙之上的。

不过，现在已经有训诂学者沿着因果性方向做了进一步探索：比如以“青”为声旁的字“清（水净）、晴（天净）、睛（目净）、情（心净）”，此前只能通过“音近义通”判断它们同源，部分当代学者结合认知语言学的原型理论，已经能初步解释这类现象背后的因果逻辑：古人把“纯净无杂质”这个核心认知原型，投射到水、天气、眼睛、情绪等不同领域，因此才会用同一个声旁“青”来造这批字，直接回答了“为什么音近就会义通”的问题，是从相关性走向因果性的典型尝试。