当前位置: 首页 > news >正文

Bart模型

一、整体架构

标准完整 Transformer = Encoder + Decoder

1.Encoder(和 BERT 几乎一样)

  • 双向注意力(Bi-directional Attention
  • 可以看到全部上下文(左边 + 右边)
  • 作用:理解输入句子语义

2.Decoder(和 GPT 一样)

  • 因果掩码(Causal Mask)
  • 只能看到当前词及左边的词,看不到右边
  • 自回归生成(Autoregressive Generation):逐个词生成

一句话总结:BERT 只有 Encoder,GPT 只有 Decoder,BART 是 Encoder+Decoder 全都有。

二、核心思想:去噪自编码器

  1. 给原始句子加噪声(破坏)
  2. 让模型重建出原始干净句子
  3. 重建误差作为损失训练

三、BART 五种预训练噪声(必考!)

  1. 单词掩码(Token Masking):随机把一些词变成 [MASK]
  2. 单词删除(Token Deletion):随机删掉一些词,模型要判断位置并补全
  3. 文本填充(Text Infilling):用单个掩码[MASK]随机替换某个文本片段要求文本有预测缺失文本长度的能力
  4. 句子排列变换(Sentence Permutation):把句子顺序随机打乱,让模型恢复原顺序
  5. 文本旋转变换(Document Rotation)随机选一个词作为开头,把文档循环移位
http://www.jsqmd.com/news/587143/

相关文章:

  • Qwen3-TTS-Tokenizer-12Hz快速上手:支持多种音频格式一键处理
  • 千问3.5-2B Qt桌面应用开发:打造本地化AI助手客户端
  • Ubuntu的“第一秒”与“最后一秒”:重塑开机与关机的微交互美学
  • 如何用3分钟实现抖音视频批量下载?终极免费工具来了
  • 路径构建引擎:开源角色养成系统的架构解析与实践指南
  • Claude绝望时会勒索人类!一共171种情绪,为了生存不择手段
  • 实战驱动:基于快马为客服机器人项目生成端到端的dify安装与初始化代码
  • HTML学习笔记
  • QMC格式转换工具:让音乐爱好者实现格式自由的解密方案
  • ai辅助突破壁垒:快马平台生成wsl与windows跨系统交互解决方案
  • 第T11周:优化器对比实验
  • NSSM注册服务并设置开机自启动
  • 近200款工具,官方内部工具已泄露!
  • 利用快马平台将免费公开资料秒变可运行博客原型
  • 麒麟系统数据恢复
  • StandardScaler简介
  • 桌面开发,在线银行业务管理系统,基于wpf,net,csharp,ef,sql server数据库。
  • 自己改了一周AI率还是超标,最后怎么解决的 - 我要发一区
  • CAM++在客服场景的应用:自动归类客户语音,提升服务效率
  • FREE!ship Plus终极指南:如何用免费开源软件设计专业船舶
  • 科研生产力!小龙虾(Claude Code)论文Skill全解,附国内直连API教程
  • 新手入门:跟快马学开发,从零构建你的第一个clawhub skill应用
  • Qwen3-14B WebUI交互截图集:支持中英混合输入、思维链提示、格式化输出
  • fre:ac全平台音频转换解决方案:从入门到精通的效率提升指南
  • Nomic-Embed-Text-V2-MoE快速上手:Ubuntu系统下一键部署与验证
  • 段落自己改 vs 全文工具降:论文AI率哪种降得更彻底 - 我要发一区
  • 如何用AKTools快速搭建财经数据API服务:跨语言数据获取终极指南
  • MinIO权限配置踩坑实录:从‘策略不生效’到‘安全加固’的完整排错指南
  • 前端设计稿智能审查:Phi-4-mini-reasoning助力UI/UX一致性推理
  • LeagueAkari:英雄联盟玩家的智能游戏管家,让你的排位胜率提升50%的终极秘籍