TransformerUNet 医学图像分割:牙齿 X 光 + PyTorch 全链路
文章目录
- TransformerUNet 医学图像分割:牙齿 X 光 + PyTorch 全链路
- 一、架构
- 二、环境
- 三、数据
- 3.1 结构
- 3.2 Dataset
- 四、模型
- 4.1 DoubleConv
- 4.2 TransformerEncoderBlock
- 4.3 TransformerUNet
- 五、训练
- 六、结果
- 七、对比
- 八、推理
- 九、调试
- 十、总结
- 代码链接与详细流程
购买即可解锁1000+YOLO优化文章,并且还有海量深度学习复现项目,价格仅需两杯奶茶的钱,每日更新
TransformerUNet 医学图像分割:牙齿 X 光 + PyTorch 全链路
一、架构
输入 (1 × 256 × 256) ↓ Encoder ├── DoubleConv (1→64) + TransformerEncoder │ └── flatten → MHA (heads=8) → reshape ├── MaxPool ×2 ├── DoubleConv (64→128) + TransformerEncoder └── MaxPool ×2 ↓ Bottleneck ├── DoubleConv (128→256) + TransformerEncoder └── 全局自注意力强化 ↓ Decoder ├── ConvTranspose ×2 + Skip (cat enc2) ├── DoubleConv + TransformerEncoder ├── ConvTranspose ×2 + Skip (cat enc1) └── DoubleConv + TransformerEncoder ↓ 1×1 Conv → Softmax ↓