当前位置: 首页 > news >正文

Transformer学习笔记(位置编码)

一. 关于位置编码:

pos表示token位置,2i和2i+1表示维度下标(奇偶)

可以看出,随着i越来越接近d/2(维度越来越往下),位置编码的值随着位置pos变换的幅度越大(正余弦周期越大),不同维度的位置编码就是不同周期的正余弦函数。这样可以让模型更容易感知两个词之间的间距k。

重点:

对于一对正余弦函数,根据三角函数的加法公式:

sin⁡(pos+k)=sin⁡(pos)cos⁡(k)+cos⁡(pos)sin⁡(k)
cos⁡(pos+k)=cos⁡(pos)cos⁡(k)−sin⁡(pos)sin⁡(k)

这意味着,存在一个只与 k有关、与pos无关的线性变换矩阵Mk​,使得:

PE(pos+k)=Mk⋅PE(pos)

深层次解释:

如果我们把 PE向量中的每一对 (sin,cos)看作二维平面上的一个点,你会发现:随着 pos的增加,这个点实际上是在这个二维子空间里做旋转运动。上面说到的矩阵MK其实是一个旋转矩阵。两个位置 pos和pos+k之间的点积,本质上取决于它们之间的夹角.
这种编码将位置信息编码成了相位(Phase)。在 Self-Attention 计算点积时,模型实际上是在衡量不同词在各个频率子空间里的相位差

这意味着模型在计算注意力时(即计算Q⋅KT时),两个词之间的点积会包含由于相对距离 k 产生的衰减或增强信号。模型不需要记住每个词的绝对坐标,它只需要通过线性投影就能感知出“这两个词相距 k 个单位”。这种平移不变性(Translation Invariance)对处理变长序列至关重要。

http://www.jsqmd.com/news/305154/

相关文章:

  • 网络安全知识汇总
  • 第二届长城杯初赛 anote
  • 基于STM32单片机火灾报警系统 智能楼宇 烟雾温度火焰防盗无线DIY
  • PyTorch镜像中的Bash/Zsh高亮插件使用体验分享
  • 基于STM32单片机甲醛检测系统 空气质量 智能家居 WIFI物联网成品
  • Z-Image-Turbo图像生成实战:Python启动脚本与输出路径管理指南
  • 实测分享:BSHM人像抠图的真实效果有多强
  • 基于STM32单片机甲醛温湿度烟雾火灾报警 空气质量检测PM2.5 系统
  • 基于STM32单片机红外线感应自动门 液晶显示 自动 手动
  • 基于STM32单片机交流电压电流电能检测系统 电功率 嵌入式DIY成品
  • 基于STM32单片机分贝检测噪音采集 PM2.5 温湿度报警物联网DIY
  • 基于STM32单片机多功能智能头盔 水位防滑 GPS GSM 语音提示
  • 基于STM32单片机恒温箱系统 2路继电器控制 蓝牙
  • 基于STM32单片机教室智能灯控制 光敏 WIFI 语音识别
  • 基于STM32单片机教室智能灯控制 光敏 蓝牙 语音识别
  • 软件测试(二)
  • 大数据领域数据共享的数据集成技术
  • Linux 之 【进程间通信】(消息队列与信号量、Systrm VIPC在内核中数据结构设计)
  • 大模型学习完全指南:3阶9步框架助你高效掌握核心技术_AI大模型高效学习指南
  • 2026年Agent元年:大模型应用工程师50w+年薪学习路线与实战指南,大模型应用工程师年薪50w
  • Linux 之 【进程间通信】(共享内存、ftok、shmget、shmat、shmdt、shctl、IPC相关指令)
  • 如何提高大数据领域数据建模的准确性和可靠性
  • CGO调用OpenCV实现多角度模板匹配性能分析
  • 基于STM32单片机烟雾温度防盗报警 物联网云平台 火灾检测系统DIY
  • Photoshop CS6 精简绿色版Photoshop CS6 精简绿色版分享
  • 基于STM32单片机物联网云平台 WIFI点滴速度液体检测 输液系统DIY
  • 【Termux】Photopea离线版部署
  • python脚本实现短剧配音
  • 洛谷 P9100 [PA 2020] Miny 题解
  • Java应用实例:简易背单词程序(更新)