当前位置: 首页 > news >正文

Mobile GUI Agent相关学习资料整理

Mobile GUI Agent

通用 GUI 智能体基座 MAI-UI

大佬说

唐杰THU

实践派

大润发杀鱼工:RL的一整年

天晴:用 RL 做 LLM 后训练:半年踩过的坑与心得

周星星:Agent 元年复盘

无大算力时,LLM 还有哪些值得做的研究

论文

自所&腾讯团队首次揭示大模型RL新机制

RL、Pre-training、Mid-training 对模型能力提升的区别

理解 LLM RL 稳定性的 insight 和实用 recipe

GPT-5-Thinking新训练方法

总结内容

深挖PPO,聊聊前身TRPO

大模型强化学习算法的演进与对比 (PPO, GRPO, DAPO, GSPO, SAPO)

LLM模型评估方法

青稞AI:唐杰和 Karpathy 的共识:AI 应用的本质是替代或增强人类工种,而不是为了做 App 而做 App
深入理解 KL 散度

多模态大模型主流架构

http://www.jsqmd.com/news/167142/

相关文章:

  • PostgreSQL在psql中执行INSERT语句时不显示插入条数信息的方法
  • AI 得流量者得天下?
  • Python3.10性能评测:Miniconda环境下PyTorch训练速度实测
  • 第一次买云服务器,我踩过的坑希望你能避开
  • 《代码大全2》前三分之二读后感
  • Linux系统下最简PyTorch安装方法:Miniconda-Python3.10实测有效
  • Dockerfile编写指南:基于Miniconda-Python3.10定制专属AI镜像
  • HTML Audio播放:嵌入Miniconda-Python3.10生成语音Token演示
  • GitHub Issue模板设计:帮助用户反馈Miniconda-Python3.10使用问题
  • Conda list查看已安装包:检查Miniconda-Python3.10中的PyTorch状态
  • 人工智能之核心基础 机器学习 第二章 监督学习
  • Jupyter Lab使用指南:在Miniconda-Python3.10中运行PyTorch代码示例
  • Markdown表格语法实战:展示Miniconda-Python3.10性能基准数据
  • GitHub Actions集成Miniconda-Python3.10实现CI/CD自动化测试
  • CondaError全面解析:Miniconda-Python3.10避免常见激活问题
  • 基于Miniconda-Python3.10镜像的技术博客工厂:为GPU算力销售引流
  • 清华镜像URL列表:Miniconda-Python3.10 pip与conda双源配置
  • Pyenv which python定位准确解释器:避免Miniconda环境混淆
  • Conda虚拟环境创建指南:Miniconda-Python3.10独立管理AI依赖
  • Linux crontab定时任务:用Miniconda-Python3.10自动执行Token生成
  • Conda初始化报错解决方案:Miniconda-Python3.10预配置环境免踩坑
  • 【拯救HMI】工业 HMI 通讯故障三连问?新手必看的排雷指南
  • 深度收藏:2026年AI发展预测与学习路径,程序员必看,小白入门
  • 绍兴企业如何选择靠谱的AI全网营销系统?超越功能清单的深度洞察
  • 生命之海的精准导航仪:Blood 600,开启靶向研究新纪元
  • 不同地区研发中心的角色如何进行定位
  • 运势运程算命程序源码公开:PHP无依赖版开箱体验
  • 0x3f第17天复习 (15:20-16.25)
  • 【拯救HMI】HMI “卡成 PPT” 怎么办?—— 性能优化指南
  • 重磅研究:血压高?常吃这2种水果,死亡风险竟然能降低40%!