当前位置: 首页 > news >正文

我读Population Based Training of Neural Networks

原文点此

1.intro

PBT是一种简单的异步优化算法,它能够有效利用固定的计算预算,通过联合优化一组模型和其超参数以最大化性能。

2.methodology

目标是优化模型f ff的参数θ \thetaθ以最大化目标函数Q ^ \hat {\mathcal{Q}}Q^, 实际性能指标Q \mathcal{Q}Q通常有别于Q ^ \hat{\mathcal{Q}}Q^。PBT的目的是在Q \mathcal{Q}Q上联合优化参数θ \thetaθ和超参数h hh, 寻找最优参数集的过程可以表述为:θ ∗ = argmax θ ∈ Θ eval ( θ ) \theta^*=\text{argmax}_{\theta\in\Theta}\text{eval}(\theta)θ=argmaxθΘeval(θ)

具体来说,θ ← step ( θ ∣ h ) \theta\leftarrow \text{step}(\theta|h)θstep(θh),θ ∗ = optimize ( θ ∣ h ) = optimize ( θ ∣ ( h t ) t = 1 T ) = step ( step ( … step ( θ ∣ h 1 ) … ∣ h T − 1 ) ∣ h T ) \theta^*=\text{optimize}(\theta|h)=\text{optimize}(\theta|(h_t)^T_{t=1})=\text{step}(\text{step}(\dots\text{step}(\theta|h_1)\dots|h_{T-1})|h_T)θ=optimize(θh)=optimize(θ(ht)t=1T)=step(step(step(θh1)hT1)hT), 这样的迭代过程计算成本很高且算得慢;受超参数h hh的影响也很大, 需要有关h hh的先验知识。

一个省事而且快的算式是θ ∗ = optimize ( θ ∣ h ∗ ) \theta^*=\text{optimize}(\theta|h^*)θ=optimize(θh),h ∗ = argmax h ∈ H T eval ( optimize ( θ ∣ H ) ) h^*=\text{argmax}_{h\in\mathcal{H}^T}\text{eval}(\text{optimize}(\theta|H))h=argmaxhHTeval(optimize(θH))

用这个算式训练N NN个模型{ θ i } i = 1 N \{\theta^i\}^N_{i=1}{θi}i=1N组成种群P \mathcal{P}P, 每个个体用不同的超参数{ h i } i = 1 N \{h^i\}^N_{i=1}{hi}i=1N优化, 目标是找到整个种群中的最优模型。

instead of采用并行搜索(每个个体各自独立地找最优解), PBT使用部分已有的解进行额外的meta-optimization, 即根据整个种群的表现调整超参数h hh和权重θ \thetaθ。实现方式:

(1) exploit, 根据种群的表现决定worker是否放弃当前解并专注于更promising的

(2) explore, 在给定当前解和超参数的条件下提出新解以更好地搜索解空间

种群中的每个个体并行训练, 当其被认为准备就绪(如优化步数达标或达到特定性能阈值)时, 其权重和超参数由exploit和explore更新(比如exploit把当前权重替换成种群中表现最优者的权重, explore用噪声随机扰动超参数)。在exploit和explore之后, 继续迭代更新。重复这样的过程直到模型收敛。

http://www.jsqmd.com/news/263720/

相关文章:

  • 完整教程:腾讯云渠道商:腾讯云轻量服务器和CVM有什么差异?
  • 机器学习周报三十一
  • Python中的JSON处理(标准库)
  • 分布式理论的认知重构:CAP 与 BASE 的真相、边界与实践逻辑 - 详解
  • Multi-Content GAN for Few-Shot Font Style Transfer(用于少样本字体风格迁移的多内容GAN)
  • 主流 AI IDE 之一的 Claude Code 介绍
  • 两两交换链表中的节点-day04
  • Mars-Admin 基于Spring Boot 3 + Vue 3 + UniApp的企业级管理系统
  • 贵金属回收攻略:本地高价回收不踩坑,今日金价实时更新 - 非研科技
  • 2026必备!继续教育TOP9AI论文写作软件测评与推荐
  • MFC 对话框Alt+F4退出程序实例
  • 告别代码!我用Trae氛围编程的方式,开发了一款公众号文章同步插件!
  • SonarQube-开源的持续代码质量检测平台
  • AI 模型输出学术内容准确率飙升97%!我只用了这个简单提示词技巧
  • 读《大明王朝1566》有感
  • 亲测好用!10款一键生成论文工具测评,本科生毕业论文必备
  • 收藏这篇就够了!AI大模型学习路线全解析:从数学基础到实战应用
  • 2026本科必备9个降AI率工具测评榜单
  • 读人本智能产品设计6原则05表达(下)
  • AI产品经理必修课:拆解大模型落地的关键能力与实战技巧
  • 亲测好用10个一键生成论文工具,研究生高效写作必备!
  • AI大模型学习路线(非常详细)收藏这一篇就够了!从零基础到进阶的完整指南+免费资源包
  • WSL2 Win11 Ubuntu22.04 D盘安装 参考的教程记录
  • 大模型六大热门岗位详解:从入门到精通的必学路径,大模型职业发展指南
  • 关于弦理论的十维自洽的个人见解
  • 【GRPC 和 HTTP】设计目标和底层构建
  • 完整教程:Python3:Fifteenth 类型注解(Type Hints)
  • 大模型学习路线图:从基础到实战,程序员必看的学习指南_大模型学习路线(2026最新)神仙级大模型教程分享
  • Node.js和包管理工具
  • 从零开始成为AI大模型产品经理:这份超全指南,建议立即收藏_AI模型产品经理学习路线