当前位置: 首页 > news >正文

IQuest-Coder-V1:国产大模型出现了新玩家

前天,除了DeepSeek发布了新工作之外,另一个国内量化团队也搞了一个大动静。

九坤投资在去年成立的至知创新研究院团队发布了 IQuest-Coder-V1。

这是一个专注于代码领域的垂类模型,参数仅40B,不是MoE结构,而是Dense架构。

模型已开源在Hugging Face[1]上,共包括四款:

  • IQuest-Coder-V1-40B-Base-Stage1
  • IQuest-Coder-V1-40B-Base
  • IQuest-Coder-V1-40B-Instruct
  • IQuest-Coder-V1-40B-Loop-Instruct

前两个都是试验中间状态产物。

后两个是最终的完全体,带Loop表示引入LoopCoder机制的模型。

它公布的评测结果相当惊人,在各种评估基准上,比claude sonnet-4.5都要好。

核心亮点:LoopCoder

这个模型的训练过程从预训练、SFT到强化学习都比较常规。

核心亮点是提出了LoopCoder这个机制。

根据其代码仓库里的这篇论文[2]所述,LoopCoder主要是为了解决复杂问题推理。

LoopCoder这个机制是要求模型在中间状态时“思考”两遍。

如图所示,第一次输入Input Token,得到潜空间的结果Latent Input。

这个结果会被共享到第二次输入,进行第二轮迭代。

在第二次迭代中,计算两种注意力:全局注意力(查询关注第一次迭代的所有键值对)和局部注意力(查询仅关注第二次迭代中的先前令牌以保持因果关系)。

两种注意力输出通过一个基于查询表示的学习门控机制进行组合,该门控制全局上下文细化和局部因果依赖的加权混合,最后输出最终结果。

这个机制乍一看有点像Agent的自我迭代:将第一轮的输出再输入到模型中得到第二轮更好的结果。

但不同的是,LoopCoder是内部进行的,效率会更高,也可以针对性优化。

看完这个机制,想到了DeepSeek提出的思维链(CoT)。

思维链是要求模型在输出时,强制把思考过程作为结果一同输出出来。

而LoopCoder是直接让模型在“脑中”思考两遍,比如让它写一个代码,它第一遍先思考要用什么技术栈,代码架构怎么做,第二遍再具体去做。

这样去理解LoopCoder的动机,似乎有几分道理。

混合语言训练

大模型对不同编程语言的掌握情况是不一样的,在做预训练时,作者团队提出了一个有价值的发现:用混合语言的方式对模型训练,优于用单一语言进行微调。

他们进一步试验出了分配比例,在最佳比例下,不同语言的协同增益效果如下表所示:

从表中能够看出,Java对其它语言的增益非常显著,特别是C#和Java语法比较接近,相比基线有20%的增幅,看来还是Java的高质量代码最多。

从最终效果上看,大模型对语言的掌握情况从弱到强满足:

C# < Java ≈ Rust < Go < TypeScript < JavaScript < Python

评估结果对比

开头的图片仅展示了部分模型对比。

对于代码生成任务而言,更详细的对比如下表所示。

从数值上看,这个模型只能做到部分领先,没领先的几个基准上,指标也不是很差。

它没有提供API,如果要测它的实际表现,必须要本地部署才行。

网友All In AI的测试表明[3],该模型引入的LoopCoder机制会导致处理速度缓慢,实用价值不高。

此外,还有人发现[4],这个模型在 SWE-bench 基准上评测时,无意触发了该基准的漏洞:在评测中“看到了未来的 Git 提交”,等于提前拿到了标准答案,因此它的 SWE-bench 成绩会虚高。

这不是研究人员刻意“作弊”,而是评测数据集的问题,去年九月前就有人发现过[5]。

总结

这个模型在架构上的创新还是有点新意的,国产开源大模型赛道又增加了一个玩家。

他们的起步策略还是挺聪明的,不直接上来就搞通用大模型,而是在已经充分被市场验证价值的编程领域开始切入。

模型更小,领域更垂直,有可能成为今年的新趋势。

参考

[1] https://huggingface.co/IQuestLab/IQuest-Coder-V1-40B-Loop-Instruct
[2] https://github.com/IQuestLab/IQuest-Coder-V1/blob/main/papers/LoopCoder_arxiv.pdf
[3] https://x.com/HaohaoHenr56041/status/2006843118969303382
[4] https://x.com/xeophon/status/2006969664346501589
[5] https://x.com/giffmana/status/1963327672827687316

http://www.jsqmd.com/news/189329/

相关文章:

  • Windows 11 LTSC 微软商店一键安装完整指南
  • GitHub加速终极指南:3分钟解决国内开发者访问难题
  • 深度学习计算机毕设之基于ResNet50的植物病害识别研究与系统应用实现
  • 5大核心功能揭秘:Translumo如何成为跨语言沟通的终极利器
  • HunyuanOCR能否用于车牌识别?测试结果显示高准确率
  • c++函数可以返回局部变量的值,但不可以返回局部变量的地址或引用
  • Nrfr终极指南:免Root实现SIM卡国家码精准配置与运营商限制突破
  • 深度学习毕设项目:基于ResNet50的植物病害识别研究与系统应用实现
  • ComfyUI-BrushNet模型配置实战:从零开始到高效使用
  • DL之Titans_MIRAS:在执行时用“惊讶度”驱动记忆写入的长期记忆架构与统一理论框架 —— 从超越 MSE 的 MIRAS 设计空间(包含 YAAD、MONETA、MEMORA 三种注意力自由
  • 出国必备!3分钟搞定手机全球通:Nrfr免Root工具真实体验
  • 虚拟机测试网速的方法
  • AMD显卡也能运行CUDA程序?终极ZLUDA兼容性配置指南
  • VisualGGPK2完全指南:流放之路游戏资源编辑终极解决方案
  • Surya OCR横向评测:数学公式与表格识别能力对比
  • 3个关键步骤让Windows Android子系统继续服务到2027年
  • Onekey Steam清单下载器:免费高效的终极解决方案
  • YimMenu完全配置指南:解锁GTA5终极游戏体验的完整方案
  • 免费终极Windows 10性能优化神器
  • LegalDoc司法文书解析:判决书中当事人信息自动提取
  • 如何快速实现电子书元数据自动化管理:Calibre豆瓣插件完整指南
  • StreamFX插件:免费打造电影级直播效果的完整指南
  • E-commerce商品详情页识别:淘宝京东图片转文字方案
  • 生肖邮票设计大赛:参赛者使用lora-scripts进行初稿创作
  • 【毕业设计】基于ResNet50的植物病害识别研究与系统应用实现
  • 鸣潮120帧极致体验:从卡顿到丝滑的完整指南
  • IDM试用期恢复终极指南:如何继续使用这款下载工具
  • AI伦理讨论焦点:lora-scripts让深度伪造技术平民化了吗?
  • Source Han Serif CN开源字体:免费商用的专业中文解决方案
  • Patreon下载神器:告别手动保存,实现批量内容智能管理