当前位置: 首页 > news >正文

ollama v0.13.3 最新发布:新增模型与功能优化详细解读

2025年12月12日,ollama v0.13.3版本正式发布。本次更新引入了多款全新模型,并对现有功能进行了优化与修复,为开发者在代码分析、多语言检索以及软件工程领域提供了更高效的支持。

一、全新模型

  1. Devstral-Small-2

    • 24B 参数模型
    • 擅长使用工具探索代码库
    • 支持多文件编辑
    • 为软件工程类智能代理提供强大能力支持
  2. rnj-1

    • 8B 参数开源权重、稠密模型
    • 由 Essential AI 从零开始训练
    • 针对代码及 STEM(科学、技术、工程、数学)领域优化
    • 性能可与当前开源权重领域的先进模型媲美
  3. nomic-embed-text-v2

    • 多语言 MoE(混合专家)文本嵌入模型
    • 出色的多语言检索能力

二、功能优化与改进

  1. 嵌入接口优化

    • 改进了/api/embed/v1/embeddings在使用时的截断逻辑
  2. 架构扩展

    • 在 Gemma 3 架构基础上扩展,支持 rnj-1 模型
  3. 模型输入修复

    • 修复了使用 qwen2.5vl 进行图像输入时出现的报错问题

三、近期更新的具体改动

  • 截断逻辑优化:修正运行时截断逻辑,并移除服务器端截断

  • rope 重构:提升模型在长上下文处理中的性能稳定性

  • rnj-1 推理支持:新增对 rnj-1 模型的推理支持

  • qwen2.5vl metal argsort 修复

  • nomic-embed-text-v2 模型实现完善

  • UI优化

    • 修复模型下载完成后能力不更新的问题
    • 使用 Ollama 接口进行用户认证与健康检查
    • 使用 requestAnimationFrame 防止文本底部被截断
  • 性能提升:升级 llama.cpp(17f7f4)版本,提升 SSM 性能

  • 命令行工具修复

    • 修正 cmd/bench 下 README 中的选项表与二进制文件名
  • 路由优化:在工具调用中增加 logprobs 输出

  • 模型调整:更新 ministral 与 devstral 的转换与超参数设置

  • 模板功能增强:新增 yesterdayDate 辅助函数

  • 嵌入性能优化:调整 embeddings 的批量大小

  • API扩展:新增 v1/responses 接口支持

  • rotary embeddings 修复:解决 ministral 3 在旋转嵌入上的问题

  • 文档更新:调整 README 内容


四、更新总结

代码地址:github.com/ollama/ollama

本次ollama v0.13.3发布,不仅带来了三款定位不同的新模型,覆盖了代码分析、科学工程以及多语言检索等多领域,同时对嵌入接口、模型架构、性能以及开发者工具进行了广泛优化,进一步提高了使用体验与运行稳定性。

http://www.jsqmd.com/news/79774/

相关文章:

  • 2.5亿参数破局多模态困境:ModernVBERT重塑视觉文档检索技术边界
  • GLM-4.5-Air横空出世:混合推理技术开启开源大模型商用新纪元
  • 论文阅读:AAAI 2026 Multi-Faceted Attack: Exposing Cross-Model Vulnerabilities in Defense-Equipped Vision
  • Unsloth Dynamic 2.0量化技术:重新定义大模型部署效率与精度边界
  • OpenAI发布Whisper Turbo模型:本地语音处理效率提升5.4倍,多语言翻译能力再突破
  • 智谱AI大模型全面免费开放:AI普惠时代正式开启
  • 终极百度网盘加速指南:免费实现快速下载的完整教程
  • 38、互联网邮件安全与Web服务器安全综合指南
  • Ring-1T重磅发布:万亿参数思维模型开启开源推理新纪元
  • 百度开源再放大招:ERNIE-4.5-VL-28B-A3B-Thinking颠覆多模态AI认知边界
  • 40、网站内容与安全全解析
  • 机器学习进阶<11>基于集成学习的多源数据融合的电商用户购买行为预测系统
  • 42、保障 Web 服务器安全:数据库访问、认证与访问控制全解析
  • 终极百度网盘下载解析工具:简单三步实现高速下载
  • 43、保障Web与文件服务安全:技术、挑战与应对策略
  • Windows右键菜单终极优化指南:5个技巧让系统飞起来
  • C++--哈希封装my_unordered_set和my_unordered_map
  • 44、FTP安全指南与服务器配置解析
  • 一个卷积后就做池化还是多个卷积后做池化?
  • 47、安全文件服务配置指南
  • 智谱AI开源GLM-4-9B-Chat-1M:突破200万中文字符上下文壁垒,多模态能力引领行业新标杆
  • 48、高效安全的文件传输:rsync 全方位指南(上)
  • League Akari 智能助手:重新定义英雄联盟自动化体验
  • 49、Linux文件共享与日志管理全解析
  • 不止于论文写作:虎贲等考 AI 解锁期刊级学术研究与深度阅读新范式
  • 机器学习进阶<12>AdaBoost与梯度提升树
  • python基础(mysql)
  • NCMconverter:解锁网易云音乐格式限制的终极解决方案
  • 探索科研新助力:理性审视宏智树 AI 科研工具的期刊论文辅助价值
  • 【附源码】新能源充电桩管理系统(源码+数据库+毕业论文+答辩ppt)java开发springboot+vue框架javaweb,可做计算机毕业设计或课程设计