当前位置: 首页 > news >正文

从训诂学到人工智能:一场两千年的相关性困局,与因果性的破局时刻

本文试图点明历次争论中被长期忽略的核心事实:训诂学之所以长期背负“唯心主义”“伪科学”的质疑,争论两千年仍无统一评判标准,更被很多人视作“无用之学”,根源从来不是传世文献或文字材料有问题,而是研究方法始终没有突破“相关性归纳”的固有局限。

一、训诂被斥“伪科学”,问题出在哪?

在公共讨论平台搜索“训诂学”,总能看到两种极端对立的观点:

①一方认为:训诂是中国传统文化的精髓,是最严谨的传统学问;

②另一方则认为:训诂是彻头彻尾的伪科学,全凭主观臆断的文字游戏。

双方争了十余年,谁也说服不了谁,但其实两种看法都有其依据。

①说训诂严谨并非过誉:乾嘉学派的学者用三百年皓首穷经,把每一个汉字的读音、字形、义项梳理考证得详实周密,其严谨程度甚至超过今天很多领域的研究者。

②说训诂是“伪科学”也并非苛责:直到今天,训诂研究仍没有普适的客观评判标准——两个字算不算同源词?一个字的本义究竟是什么?缺乏普适的、可量化的客观评判标准,难以通过可重复的实验或形式化推导进行统一验证,最终的结论往往更多依赖研究者的学术积累与行业共识。

对于任何一门学科而言,如果结论难以被证伪,很大程度上依赖学术权威的判断,在大众眼中自然和“伪科学”没有本质区别。

而训诂学之所以陷入这般境地,核心原因只有一个:它的所有论断,本质上都是相关性的归纳,而非必然性、因果性的演绎。

要特别说明的是:这种争议并非当代人的首创,早在近代西学东渐时期,西方实证科学范式传入中国,传统“小学”(训诂、文字、音韵)因为没有可重复、可证伪的实验验证体系,就曾被当时学者指出存在“主观随意性”问题,后来更一度被贴上“唯心主义”的标签,至今的公众争议其实是百年学术范式冲突的延续。

二、训诂研究的三重相关性陷阱

训诂学发展两千年,先后诞生过三种主流研究方法,但其内核始终没有跳出“寻找相关性”的逻辑:

(一)民间解字学:字形相关性

这是最基础也最受学界批判的相关性逻辑。看到“船”字是“舟加八口”,就完全脱离汉字演变历史,附会诺亚方舟上正好有八个人。

这种研究的逻辑是“字形长得像,含义就相通”,问题非常明显:太过主观随意,任何一个字都可以强行拆成几个部件,编出一套自圆其说的解释,这也是这类民间解字法常被诟病为“民科”的核心原因。

(二)传统训诂学:语音相关性

这是专业训诂研究的核心方法,也是乾嘉学派最重要的学术贡献。乾嘉学者发现,很多读音相近的字,含义也相近,因此提出“音近义通”的原则,主张“就古音以求古义,引申触类,不限形体”。这是训诂学的巨大进步,突破了字形的束缚,把训诂从拆字游戏提升到了系统研究的高度。

但它本质上仍然是“相关性”判断:“读音相近所以同源”,只回答了“是什么”,没有回答“为什么”。为什么读音相近的字含义会相通?为什么有些读音相近的字含义完全无关?有没有规律可以预判哪两个字必然同源?这些问题至今没有答案。所以才会出现同用“音近义通”的原则,甲说A和B同源,乙说A和C同源,丙说前两者都错,A和D才是同源,最终各执一词,不了了之。

(三)现代训诂学:文献相关性

这是当代训诂研究最常用的方法:学者借助计算机统计两个字在所有传世古籍中的出现频率,如果两者经常共同出现,或者可以互相替代,就判定它们含义相近。

这种方法借助了算力工具,看起来非常科学,但本质上仍然是相关性判断:“共同出现所以含义相近”,逻辑和今天的大模型完全一致——大模型也是通过统计词汇的共现频率,判断语义关联。而大模型的所有缺陷,现代训诂学也都具备:只能看到表面关联,看不到背后的因果逻辑;只能事后解释现象,不能事前预判规律;还常常出现“幻觉”,把偶然的相关当成必然的联系。

三、相关性无法替代因果性

这是问题的核心,也是绝大多数训诂研究者终身没有突破的认知局限。

①什么是相关性?是“我观察到A总是和B共同出现(所以相关性有时也可以成为共现性)”;

②什么是因果性?是“因为A的存在,所以必然导致B的发生”。

①相关性只能说明“是什么”;

②因果性才能解释“为什么”。

①相关性只能做事后的补充解释;

②因果性才能做事前的规律预判。

①相关性的结论可以被质疑;

②因果性的规律才是经得住验证的真理。

①张衡之前,所有人都看到月食会定期发生,这是相关性;

②张衡提出“月食者,地影蔽之”,解释了月食的成因,这才是因果性。

①牛顿之前,所有人都看到苹果会落到地上,这是相关性;

②牛顿提出万有引力定律,解释了苹果落地的底层逻辑,这才是因果性。

①达尔文之前,所有人都看到不同物种之间有相似性,这是相关性;

②达尔文提出进化论,解释了物种相似的根源,这才是因果性。

①门捷列夫之前,所有人都知道不同元素有不同的性质,这是相关性;

②门捷列夫整理出元素周期表,解释了元素性质周期性变化的规律,这才是因果性。

而训诂学在两千年的发展中,始终停留在“观察到相似性”的阶段:

①民间学者看到字形相似就说含义相通;

②传统学者看到语音相似就判定为同源;

③现代学者看到文献共现就说含义相近。

截至目前,绝大多数研究都没有真正解释过“为什么会有这些相似性”,也没有建立起一套因果贯通的理论体系。

这就是训诂学争论两千年仍无定论的根源,是它始终摆脱不了“唯心”“伪科学”质疑的原因,也是大众觉得它“无用”的核心理由。

要特别说明的是:相关性本身是科学研究的必经阶段,训诂学两千年积累的海量相关性成果绝非无效劳动,恰恰是后续建立因果性体系的必要前提——没有足够的现象观察、规律归纳,因果性的提炼就成了无源之水。我们指出训诂的相关性困局,绝非否定历代学者的贡献,而是希望在现有积累上再向前推进一步。

四、黄易青先生的探索

历代训诂学者中,黄易青先生真正意识到了这个核心问题。他的《上古汉语同源词意义系统研究》,是训诂史上第一次尝试建立因果性意义体系的探索:他不再满足于零散考证单组同源词,而是试图把所有同源词纳入一个统一的系统,寻找它们之间内在的、必然的联系。

他已经摸到了因果性研究的门槛,证明了同源词不是零散的个体,而是一个有机的整体,彼此的联系不是偶然的,而是有规律可循的。

但可惜的是,他没能跨出最后一步:

①他找到了系统的整体结构,却没有提炼出驱动这个系统运行的第一性原理,也没有构建出可形式化的语义本体论

(注:第一性原理与本体论本质上指向同一目标——揭示领域最根本的结构。区别在于:第一性原理是演绎推导的逻辑起点,本体论是这一结构的形式化表达。二者结合,就是将人类语义认知的底层逻辑,构建为一套可计算、可验证的理论体系。)

②他证明了音义之间存在必然联系,却没有解释为什么会存在这种联系;

③他的系统是从大量同源词中归纳出来的,而非从第一性原理演绎推导出来的。

而绝大多数训诂学者,甚至还达不到黄易青先生的研究高度:

①他们仍然用传统的相关性思维做研究,仍然用相关性的标准去批判其他研究者。

②部分学者把“批判民科”当成了学术本身,却没有意识到,自己脚下的学术地基,和他们批判的对象一样,都是建立在流沙之上的。

不过,现在已经有训诂学者沿着因果性方向做了进一步探索:比如以“青”为声旁的字“清(水净)、晴(天净)、睛(目净)、情(心净)”,此前只能通过“音近义通”判断它们同源,部分当代学者结合认知语言学的原型理论,已经能初步解释这类现象背后的因果逻辑:古人把“纯净无杂质”这个核心认知原型,投射到水、天气、眼睛、情绪等不同领域,因此才会用同一个声旁“青”来造这批字,直接回答了“为什么音近就会义通”的问题,是从相关性走向因果性的典型尝试。

五、耐人寻味的巧合:人工智能与训诂学卡在了同一个瓶颈

更值得深思的是,今天的人工智能行业投入了数万亿美元的研发资金,堆砌了天量算力,训练出了无数参数规模庞大的大模型,却始终没有解决因果推理和可解释性的核心难题,背后的原因和训诂学的困局十分相似。

至少在当前的Transformer主流范式下,大模型的核心机制是基于统计的归纳学习——其核心能力来源于对海量文本中词汇共现模式的统计归纳:

①它从海量文本中归纳出词汇之间的相关性,知道“因为”后面常常跟着“所以”,却不知道“因”和“果”之间有什么必然的逻辑联系;

②这和传统训诂学知道“音近”常常伴随“义通”,却不知道“音近”和“义通”之间有什么必然联系,完全是同一个问题。

所以:

①堆砌算力解决不了因果推理的难题,

②就像再多的文献考证也解决不了训诂学的主观性问题。

目前看来最有希望的破局路径之一,就是从相关性研究转向因果性研究:先找到人类认知的底层因果逻辑,再把这套逻辑植入人工智能系统。

而这套底层因果逻辑,我们的祖先早就写在了汉语和汉字里,藏在了训诂学这座学术宝矿中。之前没有人能把它挖掘出来,是因为所有人都拿着“相关性”的锄头,去挖一座只有“因果性”的镐头才能凿开的矿山。

结语

今天的公共讨论场上,每天都有关于训诂学的骂战:

①专业学者骂民间学者是民科,

②民间学者骂专业学者是食古不化的书呆子,

互相攻击、互相嘲讽,却没有意识到,他们其实是在同一个认知框架内争论。

他们用的是同一种研究方法:收集数据、归纳相关性。

他们都没有看到,泥潭的上方,早就有一条通往因果性研究的道路。

训诂学从来就不是伪科学,

它是人类历史上最古老、规模最庞大的认知科学实验数据集——一场持续了三千年、凝聚了十几代中国人集体认知智慧的大规模语言认知实验,沉淀了中国人三千年的语言实践和认知规律,或许是破解人工智能因果推理难题的关键线索。

它只是在等待一场范式革命:

一场从相关性转向因果性的革命,

一场从归纳法转向演绎法的革命,

一场把训诂学从“前科学”提升到具有可证伪性、可预测性的现代科学的革命。

而训意学,正是这场范式革命的先行者。我们试图从汉语同源词的意义系统中,提炼出人类认知的底层因果逻辑,建立一套从第一性原理出发的可形式化演绎语义体系——既为训诂学的现代化转型开辟全新路径,也为人工智能突破因果推理瓶颈提供来自中国的原创理论方案。

(注:本文为学术观点探讨,仅代表作者独立研究视角,欢迎相关领域研究者理性交流)

http://www.jsqmd.com/news/750955/

相关文章:

  • 基于Python与OpenCV的视频自动剪辑:原理、实现与优化实战
  • Apollo Save Tool:终极PS4存档管理工具完全指南
  • 别用树莓派自带的了!手把手教你给Raspberry Pi 4/400安装完整《我的世界》Java版(含性能调优)
  • 为什么MPC-HC在开源媒体播放器中保持技术领先:架构解析与性能对比
  • Taotoken 的 API Key 管理与访问控制功能在多人协作项目中的应用
  • GD32F4XX时钟配置避坑指南:选HXTAL还是IRC16M?APB分频设错有什么后果?
  • AppleRa1n终极指南:iOS 15-16设备激活锁完整绕过解决方案
  • 全栈开发环境自动化配置:基于幂等性与AI集成的现代工程实践
  • Open-LLaVA-NeXT:下一代开源多模态大模型架构解析与实战
  • AutoHotkey V2 开源工具集:从脚本语言到企业级技术栈扩展
  • 彻底解决Windows程序启动失败:Visual C++运行库AIO一键安装指南
  • 从故障诊断到论文创新:手把手教你用Matlab复现特征模态分解(FMD)算法(附完整代码与避坑点)
  • oh-my-openagent:模块化AI代理框架的设计原理与实战应用
  • ComfyUI TensorRT完整教程:如何让AI绘画速度提升3倍以上
  • 如何自定义一个Spring Boot Starter
  • C++27模块调试黑盒破解:GDB 14+ LTO-aware调试流、模块符号映射表逆向工具链首次公开
  • 解锁Windows RT远程桌面:RDP Wrapper Library终极解决方案
  • 告别裸机GUI:在IMX6ULL的Linux系统上为你的产品快速集成LVGL界面库
  • 从微内核到无限扩展:下一代操作系统架构深度解析与实现路径
  • 如何通过3个实战步骤掌握Photon光影包:从安装到高级定制
  • Auto_Simulated_Universe快速指南:5分钟搞定崩坏星穹铁道模拟宇宙自动化
  • DSGE模型宝库:40+宏观经济模型一站式解决方案
  • 如何快速掌握ComfyUI-Impact-Pack:10个核心技巧解锁AI图像增强的终极能力
  • 为什么你的网络调试总是不顺利?Fiddler中文版5大实用技巧帮你解决
  • 植物大战僵尸终极修改器:PVZ Toolkit完整指南
  • GD32F103跑108MHz后串口乱码?手把手教你修改STM32标准库RCC配置
  • 如何实现Claude Code多设备配置同步:开发环境一致性的终极指南
  • 告别显存焦虑:用Qwen-VL-Chat-Int4在Ubuntu上低成本玩转AI识图(附完整依赖清单)
  • 远程桌面复制粘贴失灵?别急着重装,先试试重启这个隐藏的Windows进程
  • 不只是画图:用Design Entry CIS高效管理元器件位号的实战技巧(附批量修改与排序方法)