当前位置: 首页 > news >正文

2025_NIPS_Brain-Inspired fMRI-to-Text Decoding via Incremental and Wrap-Up Language Modeling

文章核心总结与翻译

一、主要内容

本文聚焦于功能磁共振成像(fMRI)到文本的解码任务,旨在解决现有方法处理长序列时存在的内存过载和语义漂移问题。研究受人类语言理解的认知机制启发,提出了名为CogReader的脑启发式序列解码框架,核心包含两部分:

  1. fMRI表征学习:采用两阶段训练(HCP数据集预训练+目标数据集微调),结合文本引导的掩码策略(利用BERT模型计算词的语义重要性,对关键时间点的fMRI信号重点关注)和掩码自编码器(MAE),增强fMRI嵌入对文本信息的表征能力。
  2. fMRI到文本解码:将长fMRI时间序列分割为符合人类语言理解最优长度的片段,对每个片段进行增量解码(使用BART模型生成文本),并通过wrap-up机制汇总当前片段的语义信息,作为先验知识指导下一片段的解码,确保语义连续性。

实验在Narratives和Huth数据集上开展,结果表明该方法在BLEU-N、ROUGE-1、BERTScore等指标上显著优于UniCoRN、BP-GPT等现有方法,且解码长度越长,性能优势越明显。

二、创新点

  1. 提出脑启发式序列解码框架:模拟人类语言理解的增量处理和片段整合机制,将长序列分段解码并通过wrap-up机制传递语义信息,有效缓解内存负担和语义漂移。
  2. 设计文本引导的掩码策略:基于文本语义重要性选择性掩码fMRI信号,引导模型关注语义关键时间点的神经
http://www.jsqmd.com/news/511298/

相关文章:

  • LeetCode 189. 轮转数组(C语言详解|三种解法 + 图解)
  • OpenClaw飞书通道配置指南:WebSocket接入与安全认证
  • 2026年黑龙江口碑好的活动板房正规厂家推荐,景区活动板房全解析 - mypinpai
  • P4351 学习笔记
  • 【工信部等保2.0强制要求】:C语言国密模块性能达标指南(SM2签名≤8.2ms@1.2GHz,附GCC 12.3 -O3 -march=native调优清单)
  • 嵌入式累加和校验算法原理与实战
  • LeetCode 34. 在排序数组中查找元素的第一个和最后一个位置(C语言 | 二分查找)
  • 机器人控制算法实战:从PID到神经网络,如何选择最适合你的方案?
  • RK3576嵌入式平台Docker部署与NPU容器化实践
  • 2026六大城市高端腕表“指针损伤”终极档案:从劳力士夜光脱落到爱彼针片变形,那三根针正在悄悄告诉你什么? - 时光修表匠
  • 波利亚数学方法论 | 猜测、证明与建构在〈数学分析中问题与定理〉中的实践简述
  • 小众+热门全覆盖|六大城市高端腕表养护维修全攻略(全新版) - 时光修表匠
  • Linux基础学习二
  • 2026年有实力的车身改色品牌企业推荐,鹰潭地区优选 - 工业品牌热点
  • 微信小程序 洗衣店 干洗店预约系统
  • 别再傻傻分不清了!SSH端口转发三兄弟(-L/-R/-D)保姆级实战指南
  • MySQL中DROP、TRUNCATE和DELETE
  • 组态技术解析:从概念到典型应用场景
  • 探讨高性价比的车身改色企业,鹰潭怎么选择? - myqiye
  • 继电器模块原理与嵌入式驱动设计实战
  • RK3576嵌入式AI开发环境:离线代码生成与NPU推理实战
  • 238.除了自身以外数组的乘积
  • 聊聊立新菌种培训是否与时俱进,培训费用在行业中算高吗? - 工业推荐榜
  • vue3中const的使用和定义
  • Fiddler抓包工具的使用
  • MT5 Zero-Shot效果展示:短视频脚本多版本生成——情绪/长度/风格可控
  • QWEN-AUDIO新手入门:详解Vivian/Emma/Ryan/Jack四种音色怎么选
  • 分析2026年河南好用的食用菌培训企业,费用怎么算 - 工业设备
  • 通义千问1.5-1.8B-Chat-GPTQ-Int4实战:构建网络安全知识问答与漏洞分析助手
  • NAS硬盘兼容性扩展:突破群晖存储设备限制的技术方案