Versor深度解析:当AI真正学会几何——几何积注意力与递归旋子累积器
一、从点积到几何积:注意力的范式转移
1.1 传统注意力的盲区
让我们从一个简单的物理场景开始:两个电荷在空间中相互作用。
库仑定律告诉我们,作用力的大小取决于两个电荷的距离:
F=kq1q2r2F = k \frac{q_1 q_2}{r^2}F=k
让我们从一个简单的物理场景开始:两个电荷在空间中相互作用。
库仑定律告诉我们,作用力的大小取决于两个电荷的距离:
F=kq1q2r2F = k \frac{q_1 q_2}{r^2}F=k