当前位置：首页 > news >正文

14. GPU共享内存

news 2026/7/5 22:56:59

1.GPU共享内存

2.共享内存和常量缓存

1.GPU共享内存

GPU共享内存(SharedMemory)是GPU芯片内部、一小块超高速、"线程块专属的临时工作区"1).核心特点 a.在芯片内部(片上)离计算单元非常近,延迟比全局显存低几十～上百倍,带宽也高得多 b.只属于一个线程块 同一个Block里的线程可以互相读写、通信;不同Block之间完全不能互相访问共享内存 c.容量很小、是稀缺资源 一般一个SM(流多处理器)只有16KB~16384KB不等,不能滥用 d.手动控制 不像缓存是硬件自动管的,共享内存要你自己分配、同步、释放

2).它的作用 a.减少对慢全局内存的访问,把要反复用的数据先读到共享内存,反复用,而不是每次都去读显存 b.块内线程快速通信,线程之间交换中间结果,不用走慢的全局内存

2.共享内存和常量缓存

1).共享内存:适合"块内复用 + 线程通信"你在写Compute Shader时,凡是需要同一个线程块内的线程互相交换数据、或反复读取同一份数据的场景,都用它 例1:图像卷积(比如高斯模糊)—— 把一小块纹理数据读到共享内存,块内多个线程反复用,避免多次读慢的全局显存 例2:粒子邻域计算 —— 同一个Block的粒子互相查位置,通过共享内存快速交换,不用走全局显存 例3:矩阵分块计算 —— 把矩阵的一小块加载到共享内存,块内线程协作计算,提升效率

2).常量内存:适合"全局只读 + 高频复用"凡是整个Shader中所有线程都要读、且全程不变的数据,优先放常量内存 例1:Unity中Compute Shader的相机参数(投影矩阵、视口大小),光照参数(方向、强度),全程只读,所有线程都要用 例2:固定的配置参数,比如后处理的模糊半径、采样数,一次赋值,所有线程共享读取