当前位置: 首页 > news >正文

为什么bn+tanh比bn+relu效果好?

在自己手搓cudnn搭建的神经网络中,bn+relu其实效果很差!

但不知为什么网络流行就是bn+relu,bn+relu虐我千百遍,失败!仅能用一次在网络中!我才意识到要用bn+tanh,然后,这个组合多达6次,也成功了!

所以我的直觉就是bn+tanh好!

是不是显卡低级,cuda和cudnn版本低的原因呢?(win10+vs2015 c++)

显卡我用mx550,1060,cuda9.0以及cudnn7.1.4

然后mx550升级为cuda10.2,cudnn7.6也不行!

其实我们潜意识都是随大流,要不自己为什么那么不入流?!

什么时间我才能bn+relu成功呢?别人早都成功了!

虽然网上搜不到解决方案,这方面不知道为啥研究的人这么少!

没有机会抄作业!而pytorch的底层你也看不到!

yolo v3能看到源码,与我没什么两样,为什么它可以,我的不可以,必须bn+tanh?

为什么pytorch这么低的起点(bn+relu)我都 做不到?

说以很无赖!无赖的在deepseek和百度搜一搜(追求一下心里平衡):bn+tanh比bn+relu好

结果如下:(心里平衡了!可能是tanh比relu更对称!)

唉,人的意识是一样的!

什么时候才能突破bn+relu?(或者leaky relu)

http://www.jsqmd.com/news/476261/

相关文章:

  • Nanbeige4.1-3B推理能力展示:9.11 vs 9.8类复杂逻辑题精准解答案例
  • Realistic Vision V5.1 虚拟摄影棚提示词安全过滤:构建内容合规的生成系统
  • SiameseUIE镜像优势解析:免配置+高兼容+低资源+多场景四合一
  • 变频电机噪声溯源与综合治理 —— 从频谱特征到工程实践
  • 万象熔炉 | Anything XL实操手册:生成日志分析与质量归因方法论
  • Leather Dress Collection保姆级教学:如何导出单模型为独立WebUI扩展插件
  • 【Dify 0.12+版本Multi-Agent工作流权威配置手册】:官方未公开的YAML Schema校验规则与动态路由调试技巧
  • AI建模与空间转化:Scan2CAD三维建模技术指南
  • 圆管不锈钢毛细管哪个口碑好,深圳有推荐的厂家吗 - 工业品牌热点
  • Ostrakon-VL-8B效果对比:与Claude、GPT-4V多模态模型的实际应用测评
  • Gradio高级交互:实时手机检测-通用支持拖拽调整检测框与手动校正
  • StructBERT开源模型部署指南:CPU/GPU双环境兼容性测试详解
  • Gemma-3-12b-it多模态效果惊艳展示:高精度图片理解+自然语言生成
  • 告别Keil!用VS Code + EIDE插件打造高效C51开发环境(附详细配置步骤)
  • SPARROW-7z:面向Klipper的紧凑型7轴3D打印机主控设计
  • YOLOv8保姆级训练教程:从数据标注到ONNX导出全流程(2024最新版)
  • Qwen3-VL:30B实时交互展示:低延迟对话的优化成果
  • FaceFusion镜像使用技巧:如何设置参数获得最佳换脸效果?
  • 系统动力学实战:用Python模拟可持续旅游中的经济-环境-社会平衡
  • 墨语灵犀Python环境配置与包管理最佳实践教程
  • FLUX.小红书极致真实V2开发者案例:基于LoRA缩放系数实现风格强度精准调控
  • STC8HK64U国产8051功能板:双CAN+可调电源+闭环电机控制实训平台
  • 基于CW32F030的高精度数字电压电流表设计
  • 批量修改文件名的Tcl脚本
  • ROS URDF实战:手把手教你正确给sensor_msgs::JointState消息赋值(附常见错误排查)
  • Realistic Vision V5.1动态光影案例:室内窗光/户外阳光/夜景霓虹多光源模拟
  • 2026年可靠的粉碎机制造商推荐,东莞三创粉碎机口碑如何 - 工业推荐榜
  • 数码定制PET膜生产企业哪家好用,广东科森服务如何 - 工业推荐榜
  • C语言实战:数字炸弹游戏开发全流程(附完整代码与随机数生成技巧)
  • 装盒机优质厂商哪家好,分析全自动装盒机厂家优势 - myqiye