当前位置: 首页 > news >正文

Transformer核心组件功能对照表

Transformer核心组件功能对照表

模块名称所属位置核心功能关键作用
Input Embedding输入侧前置将离散的输入词(如英文单词)映射为固定维度的向量。把人类可理解的文字转化为模型能处理的数值化语义表示。
Output Embedding输出侧前置将已生成的目标词(如已翻译的中文词)映射为向量,通常与Input Embedding共享权重。保证输入、输出的语义空间一致,减少参数数量,提升语义对齐效果。
Positional Encoding输入/输出侧前置通过三角函数或可学习参数,为词向量加入位置信息。弥补Transformer无循环结构的缺陷,让模型捕捉序列的顺序依赖(如“我吃饭”和“饭吃我”的区别)。
Multi-Head Attention(自注意力)编码器内部第一层并行计算多个注意力头,让每个位置关注输入序列的所有位置。捕捉输入序列内部的全局语义依赖(如长句中“主语”和“宾语”的关联)。
Add & Norm编码器/解码器子层后先做残差连接(子层输入+子层输出),再做层归一化。缓解梯度消失问题,稳定训练过程,加速模型收敛。
Feed Forward编码器/解码器内部第二层对每个位置的向量做独立的非线性变换(通常是两层全连接+ReLU)。增强模型的特征表达能力,捕捉更复杂的语义模式。
Masked Multi-Head Attention(掩码自注意力)解码器内部第一层与自注意力类似,但会遮挡未来位置的信息(生成第3个词时,只能看前2个词)。保证生成的自回归性,避免模型“偷看”未来信息,符合人类逐词生成的逻辑。
Encoder-Decoder Attention(编解码注意力)解码器内部第二层以编码器输出为Key/Value,解码器当前状态为Query,计算注意力。实现输入与输出的语义对齐(如翻译时“英文单词”与“中文单词”的对应),让生成的内容更贴合输入语义。
Linear(线性层)输出层将解码器的输出向量映射到整个目标词表的维度。将特征向量转化为词表概率分布的对数形式。
Softmax输出层将线性层的输出转为0-1之间的概率分布。得到每个词的生成概率,选择概率最高的词作为下一个生成结果。

http://www.jsqmd.com/news/325940/

相关文章:

  • 2026年京津地区铣刨机租赁服务推荐,靠谱品牌Top10
  • ,瑞安市华东包装机械安装调试服务费用多少?其实力如何?
  • 盘点黄石口碑好的全自动粉条机推荐厂商,南阳固德威机械值得关注
  • 飞畅工业交换机价格与服务分析,售后好不好一看便知
  • 2026运动后的长牛健购买渠道分析,哪家性价比高
  • 导师推荐!2026本科生AI论文写作软件TOP9:开题报告必备测评
  • 探寻宋式美学家具,生产厂技术强、服务商靠谱的有哪些
  • 聊聊可靠的温度变送器加工厂,哪家口碑好
  • 记一次关于SRS的webrtc音频播放前15秒卡顿的排查过程
  • LeetCode 2976.转换字符串的最小成本 I:floyd算法(全源最短路)
  • 一天一个Python库:markupsafe - 让你的字符串安全又优雅
  • ETASOLUTIONS钰泰 ETA1617S2G SOT23-6 LED驱动
  • 《实时渲染》第2章-图形渲染管线-2.5像素处理
  • CISO的战略抉择:面对“量子破解”威胁,是否该押注量子密钥分发?
  • 2026年非标热收缩包装机售后服务佳的厂家排名,哪家更靠谱
  • 暂时无法解决的关于STM32F103的RTC日期更新问题
  • 水利数采网关在智慧水务系统中的应用
  • 瑞安市华东包装机械有限公司技术实力如何,附可靠品牌排名
  • 盘点国内工业葡萄糖供货商,靠谱品牌推荐哪家
  • IT 的“控”与业务的“放”:构建基于 Web 原生架构的安全数据共享便捷的平台
  • 育龙化工生产工艺如何,起批量及优惠政策怎样
  • C++ 封装 C FFI 接口最佳实践:以 Hugging Face Tokenizer 为例
  • 2026年工业交换机品牌有哪些值得选,飞畅科技靠谱吗
  • 工业智能相机优质供货商的产品性价比排名如何?
  • 盘点镜视界,规模、产品及加盟培训支持情况大汇总
  • 震惊!2026年70%测试数据由AI合成
  • 2026年东北新中式家具品牌排名,致电库岸家具选靠谱之选
  • 剖析2026年温度变送器制造商,哪家口碑和性价比双高
  • 聊聊靠谱的新中式家具品牌商,新中式客厅家具特色全揭秘
  • 情感化量子测试:当代码需要“共情力”