当前位置：首页 > news >正文

7M参数实现45% ARC-AGI准确率：TinyRecursiveModels如何用小模型实现大突破

news 2026/6/13 2:57:50

7M参数实现45% ARC-AGI准确率：TinyRecursiveModels如何用小模型实现大突破

【免费下载链接】TinyRecursiveModels项目地址: https://gitcode.com/gh_mirrors/ti/TinyRecursiveModels

TinyRecursiveModels（TRM）是一款革命性的AI模型，它以仅700万参数的轻量级设计，在ARC-AGI基准测试中实现了45%的准确率，为小模型解决复杂推理问题开辟了新路径。这个由GitHub加速计划支持的开源项目，通过创新的递归推理架构，展示了高效AI模型在资源受限环境下的强大潜力。

🌟 为什么选择TinyRecursiveModels？

在大模型主导AI领域的今天，TinyRecursiveModels以"小而美"的设计理念脱颖而出：

极致轻量化：仅需7M参数即可运行，普通电脑也能轻松部署
高效推理能力：在ARC-AGI测试中达到45%准确率，超越同规模模型30%以上
开源可扩展：完整代码与配置文件开放，支持自定义优化与功能扩展

🧠 TRM核心技术：递归推理架构

TinyRecursiveModels的核心突破在于其独特的递归推理机制。模型通过多步骤迭代优化潜在状态（Latent z）和预测结果（y），模拟人类逐步解决问题的思考过程。

TRM架构示意图：展示了输入(x)、预测(y)和推理状态(z)之间的动态交互过程

架构主要包含两个关键创新：

潜在状态递归：通过多次迭代优化内部推理状态
深度监督学习：在训练过程中对中间结果进行监督，加速收敛

💻 核心代码解析

TRM的递归推理逻辑通过简洁的代码实现：

TRM核心递归函数实现，展示了如何通过多轮迭代优化预测结果

关键实现文件路径：

模型定义：models/recursive_reasoning/trm.py
配置文件：config/arch/trm.yaml
训练入口：pretrain.py

🚀 快速开始指南

环境准备

首先克隆项目仓库：

git clone https://gitcode.com/gh_mirrors/ti/TinyRecursiveModels cd TinyRecursiveModels

安装依赖：

pip install -r requirements.txt pip install -r specific_requirements.txt

数据集准备

项目提供了多种推理任务的数据集构建脚本：

ARC数据集：dataset/build_arc_dataset.py
迷宫数据集：dataset/build_maze_dataset.py
数独数据集：dataset/build_sudoku_dataset.py

模型训练

使用预训练配置启动训练：

python pretrain.py --config config/cfg_pretrain.yaml

📊 模型评估

项目提供了ARC任务的评估工具：

python evaluators/arc.py --model-path ./results/trm_model.pt

评估结果将展示模型在不同类型推理问题上的表现，包括：

模式识别准确率
抽象推理能力评分
计算效率指标

🔬 自定义与扩展

TinyRecursiveModels支持多种架构变体，可通过修改配置文件实现：

trm_hier6.yaml：6层层次化递归模型
trm_singlez.yaml：单潜在状态简化模型
hrm.yaml：层次化递归模型

🤝 贡献与社区

作为开源项目，TinyRecursiveModels欢迎社区贡献：

报告问题：通过项目issue系统提交bug报告
代码贡献：fork仓库并提交pull request
文档改进：帮助完善使用文档与教程

TinyRecursiveModels证明了小模型也能实现强大的推理能力，为AI的高效化和轻量化发展提供了新思路。无论是研究者还是开发者，都能从这个项目中获得关于递归推理和模型优化的宝贵 insights。现在就开始探索这个7M参数的推理奇迹吧！

【免费下载链接】TinyRecursiveModels项目地址: https://gitcode.com/gh_mirrors/ti/TinyRecursiveModels

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/641569/

NumJs性能优化：如何实现高效的多维数据容器

Sky引擎源码｜Delphi2007服务端+客户端完整版，虚拟机一键运行，支持即开即用开区

SeqGPT-560M在智能法务场景：从合同文本中零样本抽取甲方、乙方、金额、违约责任

从CV模型到搜索Ranking全链路打通，SITS2026落地中必须绕过的6个认知陷阱

避坑指南：在Windows上用Qt Creator调试QGC UI启动流程的3个常见问题

NeoProgrammer实战：OTP分区读写与NR285G加密区刷写指南

Unity ARPG游戏源码工程（5.6版）｜含任务系统、背包管理、商店交易、装备系统、野外怪物与技能体系

FunASR Paraformer方言模型实战：如何用200小时四川话数据，将字错率降到可商用水平？

Python的__complex__第三方库

PDPS机器人仿真软件：从虚拟到现实的工业自动化革命

LOL悠米辅助工具版｜莎莉、格局小超梦、猩猩诺手等顶流主播同款｜+安装教程+终身使用

Jitsi Meet前端组件库：可复用UI元素与开发规范

2026年木箱包装深度选型指南：如何为工业设备匹配最佳方案？ - 速递信息

告别排版噩梦：《经济研究》LaTeX模板让你专注学术创作

钉钉、企业微信与飞书：三大企业协作平台的功能对比与选型指南

如何从零构建高效ChatGPT：nanochat架构完整解析与实践指南

2026新托福备考指南：家长选型+零基础痛点+大学生适配（多家机构测评权威版） - 速递信息

GTE-Base-ZH在操作系统日志分析中的应用：异常模式识别

英雄联盟LCU工具集终极指南：Akari自动化助手完整使用教程

Faye性能优化：内存引擎与代理引擎的配置与调优终极指南

【仅限前500份】2026奇点大会闭门报告泄露：多模态翻译系统在医疗会诊场景的F1-score提升23.6%关键路径

SHAP值深度解读：如何从XGBoost回归模型中挖掘出像‘车重影响油耗’这样的故事

ComfyUI-Manager依赖管理终极指南：5分钟掌握pip与uv的高效切换策略

电赛电源进阶——C2000F2800157实战笔记5——CPU定时器中断配置与精准延时实现

2026 年 13 大主流软文推广平台深度测评：全场景选型 + 全域营销攻略 - 博客湾

保姆级教程：用MATLAB/Simulink搭建线控转向（SBW）仿真模型（附模型文件）

Nanbeige 4.1-3B 面试准备神器：针对Java题库的智能解析与拓展

大模型涨价潮来了：开发者的账单，正在悄悄翻倍

GitHub Extension故障排除大全：10个常见问题与快速解决方案

如何在Android手机上恢复日历事件（成功率 98%）