当前位置: 首页 > news >正文

Determined:一个集成的深度学习训练平台

文章目录

  • Determined:一个集成的深度学习训练平台

Determined:一个集成的深度学习训练平台

开源项目 Determined 是一个面向深度学习的一体化平台,目前已获得 3,225 个 Star:

Determined 兼容 PyTorch 和 TensorFlow,覆盖了模型训练中的多个环节:分布式训练、超参数调优、GPU 资源管理以及实验追踪。

项目核心功能分为四个方向:

  • 分布式训练:将训练任务拆分到多台机器或多张 GPU 上并行执行,缩短训练周期。
  • 超参数调优:内置自适应搜索算法,自动寻找更优的超参数组合。
  • 资源管理:对集群中的 GPU 等资源进行调度和分配,降低云端的算力开销。
  • 实验追踪:记录每次实验的配置、代码版本和结果,保证可复现性。

Determined 由三个主要部分组成:Python 库、命令行工具(CLI)和 Web 界面。

Python 库

现有 PyTorch 或 TensorFlow 代码可以通过继承 Trial 类来接入 Determined:

fromdetermined.pytorchimportPyTorchTrialclassYourExperiment(PyTorchTrial):def__init__(self,context):...

也支持通过 Core API 按需调用所需功能:

importdeterminedasdetwithdet.core.init()ascore_context:...

命令行工具

CLI 支持在本地快速启动集群:

det deploylocalcluster-up

也支持部署到 AWS 或 GCP:

det deploy aws up

提交训练任务时,通过 YAML 文件配置分布式训练和超参数搜索策略:

det experiment create gpt.yaml.
resources:slots_per_trial:8priority:1hyperparameters:learning_rate:type:doubleminval:.0001maxval:1.0searcher:name:adaptive_ashametric:validation_losssmaller_is_better:true

Web 界面

Web UI 用于查看 loss 曲线、超参数分布图、代码快照、模型注册表、集群利用率、调试日志和性能分析报表等。

安装

通过 pip 安装 CLI:

pipinstalldetermined

安装后使用det deploy在本地或云平台启动集群。项目同时支持 Kubernetes、Slurm 和 PBS 等环境的部署。

Determined 仓库内包含 30 余个示例项目,涵盖常见模型和任务场景,可直接用于熟悉平台的用法。

时支持 Kubernetes、Slurm 和 PBS 等环境的部署。

Determined 仓库内包含 30 余个示例项目,涵盖常见模型和任务场景,可直接用于熟悉平台的用法。

http://www.jsqmd.com/news/947304/

相关文章:

  • 计算机重装系统出现SYSTEM磁盘?
  • 量子上三角矩阵代数UTq(n)的构造与Hopf结构解析
  • 高端音频旋转电位器怎么选?ALPS RK14J11R000H VS TONEVEE TV14 参数PK
  • 公平k中心聚类算法:原理、优化与应用
  • 基于深度学习的文本自动摘要系统
  • 推荐一个适合维保公司的报修系统,支持多报修单位独立管理
  • 第十章:最佳实践、完整配置模板与排障
  • 手机信号满格却上不了网?一文搞懂LTE/5G的PLMN选网与漫游机制
  • PHP域名解析与CDN加速技术
  • 告别选型内耗,大模型API 采购中转成为企业 AI 降本增效新支点
  • 避坑指南:STM32F103标准库DAC配置的那些“坑”与最佳实践
  • All-in-one数据底座的价值与实践:基于Harness的解读
  • 大模型能力演进:从版本幻觉到多模态原生表征
  • Gemma-2本地部署实战:手机电脑跑通2B大模型全指南
  • 利用快马内置git环境,三步完成项目原型创建与版本初始化
  • ZYNQ Linux下UIO中断配置踩坑记:从/dev下找不到uio设备到按键触发成功
  • Gemini 3.0实战指南:多模态理解与长上下文推理落地方法论
  • C#抽象类接口 项目实操选型清单(开发直接对照)
  • 开发2天,测试2个月:AI代码让谁偷懒了?
  • ARKFCM algorithm
  • 效率飙升:快马AI为你自动生成CentOS7运维管理效率工具包
  • 2026年留学生降AI指南:实测3款结构级优化工具,英文论文轻松过Turnitin检测 - 降AI实验室
  • 2026年北京工伤律师推荐:5位专业实力派精选 - 本地品牌推荐
  • STK COM互联避坑指南:手把手教你用MATLAB创建向量和角度,解决‘名字重复报错’和‘参数设置’难题
  • C#抽象类 接口 面试 3 道笔试题(含标准答案,面试高频)
  • 手机号定位查询系统:3秒获取号码归属地与地理位置
  • 十年教学经验总结:新手小提琴怎么选?全价位高口碑机型实测推荐
  • 避坑指南:STM32 HAL库下TM1640时序调试的那些事儿(基于SysTick和定时器两种延时)
  • 0.005mm同轴度,圆樽底模轴的车削精度怎么保证
  • 第三章:界面操作、会话管理与内置命令