当前位置：首页 > news >正文

Nex-N2-mini：新一代智能体思维模型，如何快速上手部署与使用

news 2026/8/3 20:24:01

Nex-N2-mini：新一代智能体思维模型，如何快速上手部署与使用

【免费下载链接】Nex-N2-mini项目地址: https://ai.gitcode.com/hf_mirrors/nex-agi/Nex-N2-mini

Nex-N2-mini是基于Qwen3.5-35B-A3B-Base构建的新一代智能体思维模型，具备强大的Agentic Thinking能力，能够在真实环境中驱动复杂、长期任务，提供稳定的端到端结果。作为开源项目的一部分，它为开发者和企业提供了高效的本地部署和使用方案。

🌟 什么是Nex-N2-mini智能体模型

Nex-N2-mini通过Agentic Thinking框架统一了推理、工具使用和环境执行能力，形成了一个闭环系统，包括需求理解、任务规划、代码实现、环境反馈、评估调试和持续迭代等环节。该框架包含两个核心部分：

Adaptive Thinking：模型能够自主决定思考时机和深度，简单任务快速执行，关键决策深入推理
Coherent Thinking：在通用推理和多样化智能体任务中保持一致的推理范式，确保跨任务和模态的能力稳定迁移

在实际智能体工作流中，Nex-N2-mini在智能体编码、深度研究、工具调用和终端执行等方面表现出色，在多个权威基准测试中较上一代Nex-N1有显著提升。

🚀 本地部署步骤

1️⃣ 准备环境

首先需要安装定制化的sglang分支，这是运行Nex系列模型的推荐服务方式：

# 克隆定制化的sglang分支 git clone https://gitcode.com/hf_mirrors/nex-agi/sglang.git cd sglang # 安装Python依赖包 pip install --upgrade pip pip install -e "python"

2️⃣ 启动Nex-N2-mini服务

在配备2×H100的服务器上（CUDA 13.0环境），使用以下命令启动服务：

python -m sglang.launch_server \ --model-path /path/to/your/model \ --tp 2 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer

🐳 Docker部署方案

如果偏好容器化部署，可以使用预构建的Docker镜像nexagi/sglang:v0.5.12，其中已预装定制化的sglang分支：

docker run --gpus all --shm-size 32g --ipc=host \ -p 30000:30000 \ -v /path/to/your/model:/model \ nexagi/sglang:v0.5.12 \ python3 -m sglang.launch_server \ --model-path /model \ --tp 2 \ --host 0.0.0.0 --port 30000 \ --reasoning-parser qwen3 \ --tool-call-parser qwen3_coder \ --mamba-scheduler-strategy extra_buffer

⚙️ 推荐的采样参数

为获得最佳生成质量，建议使用以下采样参数：

temperature: 0.7
top_p: 0.95
top_k: 40

🔧 功能调用与推理解析

启用函数调用

Nex系列模型支持强大的函数调用能力，启动服务器时添加--tool-call-parser qwen3_coder标志即可启用：

python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder

启用推理解析

Nex系列模型会生成明确的推理轨迹，添加--reasoning-parser qwen3标志可以将推理内容与最终响应分离解析，可与函数调用解析器结合使用：

python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder --reasoning-parser qwen3

📊 模型性能亮点

Nex-N2-mini在多个基准测试中表现优异，特别在以下方面：

Agent任务：BrowseComp 74.1分，GDPval 1402分，Toolathlon 33.3分
编码与软件工程：SWE-Bench Pro 50.2分，Terminal-Bench 2.1 60.7分
通用推理：GPQA Diamond 82.6分，IFEval 89.1分

这些成绩表明Nex-N2-mini在处理实际生产力场景（如OpenClaw单人公司工作流、端到端游戏开发以及Web和多模态生成）时具有出色的可用性、稳健性和稳定性。

📋 配置文件解析

模型配置文件config.json包含了关键参数，如：

hidden_size: 2048 - 隐藏层大小
num_hidden_layers: 40 - 隐藏层数
num_attention_heads: 16 - 注意力头数
num_experts: 256 - 专家数量
max_position_embeddings: 262144 - 最大位置嵌入

这些参数共同决定了模型的能力和性能特征，适合需要深入了解模型架构的开发者参考。

🎯 快速开始使用

完成部署后，您可以通过发送请求到服务器端口（默认为30000）来使用Nex-N2-mini模型。结合推荐的采样参数和适当的提示词设计，可以充分发挥模型在代码生成、任务规划和复杂问题解决方面的优势。

无论是构建智能代理、自动化开发流程还是处理需要深度推理的任务，Nex-N2-mini都能提供稳定可靠的支持，帮助您在实际生产力场景中取得高效成果。

【免费下载链接】Nex-N2-mini项目地址: https://ai.gitcode.com/hf_mirrors/nex-agi/Nex-N2-mini

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

查看全文

http://www.jsqmd.com/news/985072/

5分钟快速上手：用PyTorch构建图卷积神经网络实战指南

clianpro超链PRO高级技巧：5个批量下载大文件的最佳实践指南

算法题（236）：繁忙的都市

终极数据科学竞赛解决方案库：gh_mirrors/dat/Data-Science-Competitions项目全面解析

5个实战技巧：如何用Elasticsearch RTF快速搭建中文搜索系统

TradingAgents-CN智能交易系统：如何5分钟构建你的AI投资分析团队？

2026年天津日语培训日本留学中介推荐:五家优选深度解析 - 科技焦点

如何快速上手StructBERT-base：3分钟实现中文情感极性判断

揭秘推进器分配矩阵(TAM)：uuv_simulator推力管理核心技术

Flask-Sockets与Ajax协同作战：构建带用户认证的实时Web应用完整案例

如何扩展statannotations：自定义统计测试函数与标注格式的终极指南

如何选择儿童淋浴盆？2026儿童淋浴盆选购指南 - 资讯纵览

函数的稳定性表现差异 IMMUTABLE | STABLE | VOLATILE

中石化加油卡余额闲置，正规流转平台怎么挑选 - 京卡收卡券回收

终极Voyager指南：5个技巧掌握Laravel管理后台开发

cann/sip列方向逐点乘算子

波形护拦板厂家选择哪家：五步科学决策流程与四家候选厂商实测 - 品牌2026

NPU与CPU部署对比：FinguAI-Chat-v1-openmind性能优化终极指南

长春重疾险确诊即赔是真的吗？李晓伟律师：条款里藏着你不知道的门槛 - 行路心安

GitHubDaily实战指南：如何高效挖掘全球开源宝藏提升开发技能

兰州黄金回收实测六大合规门店横评 - 余生黄金回收

Origin 2024 进行语言切换后仍然显示为英文

2026苏州黄金回收行业新规解读靠谱变现机构推荐 - 奢侈品回收测评

2026年6月临沂黄金市场最新动态与买卖回收全攻略 - 润富黄金回收

终极指南：如何在Neovim中配置nvim-jdtls实现高效Java开发

黄金大降急出手？收的顶回收价格仅比大盘低 3 出手不踩坑 - 奢侈品回收测评

南昌黄金行情解读与变现时机把握 - 润富黄金回收

linux 内存初始化过程

为什么选择Flask-Sockets？解析这款WebSockets扩展的核心优势与适用场景