当前位置: 首页 > news >正文

ppo 找出口模型 训练 笔记 26/1/13

cnn模型大小我给他控制在训练耗时30s左右(4060ti)

动作空间6个:4个移动2个转头,因为一开始都要跑一遍,动作太多需要跑更多步才能吃到正反馈

我现在设置是60步一episode,5 episode训练一次

转头70度左右,前后移动控制在4s,时间模型可以调,给了模型位移程度的控制,时间设置这么长也是为了能像无头苍蝇一样先把环境用脚完全跑一遍

第3个episode就已经跑出来正反馈了(距离门很近)

这个模型我没想到的是,它训练出来,是用屁股走路的,后退当前进走到门旁边

奖励是门的面积/10000,门越大奖励越高,面积大于30w就给大奖励

早上用小碎步是能收敛的这种奖励,越训练得分越多,早上哪个架构大一点训练2分钟

yolo我还得重新训练一下近距离的情况,遇到了贴着门太大yolo没识别出来的情况

可能就是因为这样模型收敛不了

http://www.jsqmd.com/news/240795/

相关文章:

  • 【基于机器学习的租房信息分析系统】Python+mysql+Django,(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)
  • 教你如何认识数控车床代码、坐标、结构编程、加工工艺
  • 基于python机器学习的电商商品分析与预测(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)
  • 【计算机毕业设计案例】基于python_CNN卷积神经网络对猫狗识别基于python_CNN深度学习卷积神经网络对猫狗识别
  • 国产力量崛起:2026十大本土HR软件厂商深度盘点
  • 【用AI指导人生、沟通、相处、冲突】遇事容易激动,易怒,情绪不稳定,感觉精神有点问题。需要平常心。需要找能代我沟通的人。不顾别人的感受。老感觉自己是受害者。心态问题,沟通问题。
  • 计算机深度学习毕设实战-基于CNN卷积神经网络对猫狗识别基于python_CNN深度学习卷积神经网络对猫狗识别
  • 怎么分析LLM在并发访问时的性能瓶颈?
  • 出海新机遇:打造海外打车系统的核心逻辑与本地化关键
  • 【递归】判断是不是二叉搜索树
  • 计算机深度学习毕设实战-基于python-AI深度学习卷神经网络对狗表情训练识别基于python-AI深度学习对狗表情训练识别
  • 港科大突破:AI实现医学文本引导图像精准分割
  • 怎么实现AI的多轮对话功能?
  • 深度学习毕设选题推荐:基于卷积神经网络对猫狗识别基于python_CNN深度学习卷积神经网络对猫狗识别
  • 深度学习毕设选题推荐:基于卷积神经网络对猫狗识别基于python_CNN深度学习卷积神经网络对猫狗识别
  • 牛客CEO叶向宇:从AI工具迈向AI Agent,构建人机协作新关系
  • 【数组实现双端队列】判断是不是完全二叉树
  • 深度学习毕设选题推荐:基于卷神经网络深度学习对狗表情训练识别基于python-AI深度学习对狗表情训练识别
  • 深度学习毕设选题推荐:基于卷神经网络深度学习对狗表情训练识别基于python-AI深度学习对狗表情训练识别
  • 当人工智能遇上科学教育:多智能体系统让科学视频理解进入新纪元
  • Shopee:抓住Z世代,校招破局的三重路径
  • 公司3D年会抽奖神器来了最新年会抽奖软件,无需安装,免部署,一键解压即可使用
  • 【从上到下】判断是不是平衡二叉树
  • 配置ssh解决https不稳定的问题
  • 以长上下文处理能力提升:GPT-5.2如何处理256K tokens的超长文本
  • Meta OA 2026 全 AC 实战:CodeSignal 70 分钟 4 题拆解 + 高分技巧,附北美大厂 OA 通关指南
  • 强烈安利!研究生必用TOP10 AI论文网站测评
  • 寒假第一次作业
  • 计算机等级考试—软考文法题
  • 怎么优化RAG的检索效果?