当前位置: 首页 > news >正文

学习如何聚合零样本大型语言模型代理以进行企业披露分类

摘要

本文研究一个轻量级训练聚合器是否能够将多样化的零样本大语言模型判断整合为更强的下游信号,用于公司披露分类。零样本大语言模型无需针对特定任务进行微调即可阅读披露文本,但其预测结果常因提示词、推理方式和模型家族的不同而存在差异。我采用一个多智能体框架来解决这一问题:三个零样本智能体各自独立阅读每份披露文件,输出情感标签、置信度分数和简短理由。随后,一个逻辑回归元分类器将这些信号聚合起来,预测次日的股票收益方向。

我使用的样本包含2018年至2024年间纳斯达克和标普500指数成分公司发布的18,420份公司披露文件,并与次日的股票收益进行匹配。结果表明,经过训练的聚合器优于所有单一智能体、多数投票、置信度加权投票以及FinBERT基线。平衡准确率从最佳单一智能体的0.561提升至训练聚合器的0.612,在那些当前业绩强劲但伴随弱指引或风险上升的披露文件中提升最为显著。这些结果表明,零样本大语言模型智能体捕捉到了互补的金融信号,而有监督的聚合可以将跨智能体的分歧转化为更有用的分类目标。

1 引言

文本信息在实证金融研究中扮演着日益重要的角色。过往研究表明,新闻报道、公司披露以及投资者沟通中蕴含着关于资产价格和公司表现的可预测信息(Tetlock, 2007; Tetlock et al., 2008; Price et al., 2015; Huang et al., 2014; Li, 2008)。对监管文件、财报电话会议和在线平台的研究进一步表明,从文本中提取的情感和注意力能够影响交易行为和收益动态(Loughran and McDonald, 2011; Da et al., 2011; Chen et al., 2014)。上述文献证实,金融文本中包含了对于资产定价具有经济意义的信号。

近期研究通过引入变换器模型和大语言模型扩展了这一领域,这些模型能够捕捉到词典方法常常遗漏的上下文和语义信息(Devlin et al., 2019; Liu et al., 2019; Zhang et al., 2022; Huang et al., 2023; Kirtac and Germano, 2024)。更广泛地看,最新的情感分析研究表明,当特定领域的标注成本高昂或难以持续维护时,零样本和少样本大语言模型方法会颇具吸引力(Wang and Luo, 2023; Bai et al., 2024; Hellwig et al., 2025)。然而,零样本大语言模型的输出往往在提示词和推理路径上表现出不稳定性。这一问题对于公司披露而言尤为突出,因为此类文本的语言通常是混合性的,而非单一地积极或消极。一份披露文件可能报告了强劲的已实现盈利,但同时降低了未来指引;也可能宣布营收增长,却同时揭示了诉讼、监管或流动性风险。一个提示词可能过度关注当前业绩,而另一个提示词可能过度强调风险表述,因此单一零样本判断反映的可能只是提示词的侧重点,而非披露文件的完整权衡。

这为自然语言处理和金融学两个领域都提出了一个自然的问题:零样本智能体之间的分歧能否化劣势为优势?多智能体大语言模型系统通常以推理的多样性为出发点,近期研究表明,引入更多智能体并加以聚合可以改进个体输出(Li et al., 2024; Fei et al., 2023)。公司披露提供了一个有用的测试场景,因为此类文本包含竞争性信号、特定领域词汇以及可以通过下游市场结果来评估的短期后果。因此,它非常适合研究聚合多个零样本视角所产生的分类信号,是否能优于任何单一智能体或简单投票规则的表现。

我通过一个用于公司披露分类的多智能体零样本框架来解答这一问题。三个零样本智能体从不同的金融视角阅读同一份披露文件,并返回一个情感标签、一个置信度分数以及一段简短理由。随后,我训练一个轻量级元分类器,将这些联合输出聚合起来,用于预测次日的股票收益方向。我并未对基础大语言模型进行微调,仅训练聚合层。这种设计使系统保持简洁、数据高效,并与近期零样本多智能体情感分析的研究方向保持一致(Fei et al., 2023; Wang and Luo, 2023; Bai et al., 2024)。这也符合实际的金融应用场景:虽然有大量文本可用,但高质量的情感标签稀缺或构建成本高昂(Pustejovsky and Stubbs, 2013; Geva et al., 2019; Paullada et al., 2021)。

本文主要有三点贡献。第一,我引入了一个紧凑的多智能体零样本框架用于公司披露分类。第二,我检验了经过训练的聚合器在样本外收益方向分类上,是否优于单一智能体和投票基线。第三,我通过对混合信号披露的简短分析,展示了聚合作用最为显著的场景。

http://www.jsqmd.com/news/543175/

相关文章:

  • 基于Simulink的燃料电池系统综合建模与控制研究:包含电堆及空气、氢气系统1:1搭建过程与...
  • 2026冲锋衣采购决策指南:五大口碑厂家多维深度测评 - 2026年企业推荐榜
  • AI写论文工具怎么选?9款写论文的AI软件指南,让学术论文创作如鱼得水! - 掌桥科研-AI论文写作
  • 2026年玻璃钢管道市场深度测评:五大实力厂商全景解析与选型指南 - 2026年企业推荐榜
  • 别只盯着相位噪声:VCO设计中被忽略的‘噪声耦合’与电源完整性实战
  • ContextMenuManager:革新性Windows右键菜单管理工具
  • Qwen3-0.6B-FP8惊艳效果:Qwen3-0.6B-FP8在中文法律条文理解任务中表现优异
  • LeetCode 236. 二叉树的最近公共祖先:深度优先搜索的应用
  • 零基础搞定qfluentwidgets组件库:从安装到实战UI设计(避坑指南)
  • 别再只用RSA-PKCS#1 v1.5了!聊聊那些年我们踩过的CCA2攻击坑,以及如何用OAEP和ECIES正确防御
  • 实战vibe coding:在快马从氛围描述到一键部署可用的灵感记录工具
  • 专业视角:2026年环氧地坪漆领域五大服务商全景扫描 - 2026年企业推荐榜
  • 3步构建NTQQ机器人开发环境:LLOneBot实战指南
  • 实战指南:利用快马ai生成comfyui电商换背景应用,从需求到落地
  • ComfyUI-WanVideoWrapper视频生成插件全解析:从技术原理到场景落地
  • 2026年玻璃钢风管批发厂家综合实力Top5:专业采购选型指南 - 2026年企业推荐榜
  • ATmega328P寄存器级开发:裸机嵌入式硬件控制实战
  • 超越typora:用快马ai打造支持实时协作与版本管理的团队文档工具
  • 2026年回收二手压滤机专业公司口碑排行,衡水昱晟名列前茅 - 工业设备
  • 从入门到精通:Java 多线程基础、线程安全、锁机制与工程实践
  • 看看泉州厦门婚礼礼服定制性价比高的店,有哪些推荐? - 工业品网
  • 2026成都户外服采购指南:五大实力服务商深度解析 - 2026年企业推荐榜
  • 三月七小助手:星穹铁道智能自动化工具终极指南
  • wan2.1-vae创意设计师指南:用AI辅助完成概念草图→线稿→上色→成图全流程
  • 陀螺仪技术原理与MEMS应用解析
  • Go语言中的性能分析与调优
  • 告警疲劳自救指南:用ELK Stack搭建智能日志分析平台
  • 袁记云饺、曼玲粥、吉野家、阿香米线口味选择攻略 日常用餐不踩雷 - 每日资讯速递
  • 2026年,河南塑胶跑道施工如何选?深度剖析制造商的技术内核与实战价值 - 2026年企业推荐榜
  • OpenWebUI接入阿里云百炼 Coding Plan 模型解决方案