当前位置: 首页 > news >正文

Remoroo:通宵自主研究代码,验证位每字节降低 31%,结果可复现!

自主研究实例

3 月 31 日的 remoroo 会话中进行了自主研究。读取 program.md 后,基线验证位每字节(val_bpb)为 2.2396(提交编号 9138841),每个实验时间预算 20 分钟。进行 30 次实验,保留 8 次,舍弃 22 次,验证位每字节从 2.2396 降至 1.5484,降低 31%,结果已验证且可复现。

手动机器学习研究与 Remoroo 的对比

没有 Remoroo 的情况

手动进行机器学习研究操作如下:

$ vim train.py
> 调整学习率 learning_rate=3e-4
$ uv run train.py
> 等待 60 分钟…
> 验证位每字节(val_bpb):2.24(无变化)
> 尝试批量大小 batch_size 为 2^15…
> 再等待 60 分钟…
> 损失值为 NaN。
$ git checkout .
两小时过去毫无进展,且无结果判定、结构化流程和验证依据。
使用 Remoroo 的情况

使用 Remoroo 时,运行命令 $ remoroo run --local program.md,完成 30 次实验,保留 8 次,舍弃 22 次,验证位每字节从 2.24 降至 1.55,结果已验证且可复现,用户可在睡梦中等待完成。

Remoroo 工作原理

撰写规范文件(如 program.md),让 Remoroo 指向该文件,它会在夜间运行实验。规范文件 program.md 有时间预算(如 1200),指标为验证位每字节(val_bpb),涉及文件 train.py(含模型、优化器、训练循环),评估 prepare.py 用于评估验证位每字节(evaluate_bpb)且固定不可修改。流程为 P - 规划、E - 编辑、T - 训练、E - 评估验证位每字节(val_bpb),并与基线对比。train.py 代码改动如下:

- ATTN_PATTERN = "L" * DEPTH
+ ATTN_PATTERN = "SSSL"
示例计费以积分(俳句小时单位)计算,与模型层级有关,详见 [定价](/pricing)。

经过验证的结果

学习率调度搜索

验证位每字节(val_bpb)从 2.24 降至 1.99,降低 11%。train.py 进行 14 次实验,保留 6 次,结果已验证。

架构搜索

验证位每字节(val_bpb)保持 1.55 不变。采用带状注意力机制(SSSL),train.py 进行 30 次实验,保留 8 次,结果已验证。

多目标优化

验证位每字节(val_bpb)加内存的 3 项约束条件全部通过。train.py 进行 22 次实验,保留 5 次,结果已验证。可 [查看所有基准测试 →](/benchmarks)。

Remoroo 与代码编写代理的区别

代码编写代理Remoroo
时间尺度数小时至通宵
任务范围进行 30 次实验的搜索
执行方式沙盒化、有时间预算
指标评估固定评估工具
保留/舍弃决策基于指标自主决策
失败处理基于具体情况恢复
输出结果经过验证的补丁 + 验证依据
可复现性工件重放 + git
计费方式以积分(俳句小时单位)计算运行时长

Remoroo 不是靠猜测,而是有验证依据。30 秒即可完成安装,免费套餐包含每月运行积分,详见 [定价](/pricing)。安装命令为 $ pip install remoroo,还可安装 CLI 并 [阅读文档 →](/docs)。

http://www.jsqmd.com/news/665411/

相关文章:

  • 开发传统手工记账留存价值数据比对小程序,统计智能记账VS珠算手工做账效率,容错率,量化留存教学价值。
  • 生产网络故障复盘:网络分割与灰度发布事故
  • 如何完全掌控你的微信数据:WeChatMsg终极指南与数字记忆管理实践
  • 选降AI率工具总踩坑?看懂这份排行榜背后的评测标准 - 我要发一区
  • WebPlotDigitizer完全指南:如何从图表图片中快速提取数据
  • 有实力的气动元件一站式服务公司推荐,诚信经营 - 工业设备
  • Windows 10终极精简指南:用Win10BloatRemover让你的旧电脑飞起来!
  • 从电赛到毕设:如何用OpenMV+STM32 HAL库复刻一辆智能送药小车(附完整代码与PCB)
  • ComfyUI-Impact-Pack:解决SAM模型加载失败的3步快速指南
  • 20253901 2025-2026-2 《网络攻防实践》实践5报告
  • Wan2.2-I2V-A14B安全实践:模型API的鉴权、限流与防滥用设计
  • 游戏Mod与安全测试:深入浅出用MinHook实现函数热替换(以修改游戏内存和监控API为例)
  • 抖音下载器:从内容收藏到批量管理的全能解决方案
  • N_m3u8DL-CLI-SimpleG:告别命令行,三步完成M3U8视频下载
  • 分享充电电源车按需定制经验,正规厂家哪家口碑好 - 工业推荐榜
  • 2026年大庆GEO优化公司推荐top5:专业服务商选型参考与核心能力解析 - 商业小白条
  • 探寻通风管道制造商哪家好,玻璃钢、镀锌通风管道厂合作案例多的推荐 - 工业品牌热点
  • 从无人机避障到机器人抓取:深入聊聊双目视觉中‘视差与深度成反比’到底意味着什么
  • Steam成就管理器:3步解锁Steam游戏成就的完整指南
  • 如何一键搞定Android驱动安装:Windows平台终极解决方案
  • HEIF Utility:打破Windows平台HEIF格式壁垒的得力助手
  • Taskbar11完整使用指南:解锁Windows 11任务栏个性化设置
  • MusicFree插件完全解决方案:打造跨平台音乐聚合生态
  • 用Qwen-Image-2512-SDNQ做设计:快速生成粒子特效与流体艺术图
  • 终极指南:如何使用applera1n免费绕过iPhone激活锁(iOS 15-16.6.1)
  • Keil MDK升级到Arm Compiler 6后,我的NO_INIT变量配置踩坑实录与修复指南
  • OpenCore Legacy Patcher:让老旧Mac焕发新生的5步完整指南
  • 网络测试命令
  • VideoDownloadHelper终极指南:解锁网页视频下载的完整解决方案
  • 如何快速配置八大网盘直链下载助手:完整操作指南与实用技巧