当前位置：首页 > news >正文

商汤推新一代轻量化模型，Token 消耗降 60%，多场景实战表现亮眼！

news 2026/7/15 13:10:33

商汤推出新一代轻量化多模态智能体模型，Token 消耗降 60%，多场景实战表现亮眼！

今天，商汤正式推出新一代轻量化多模态智能体模型——商汤日日新 SenseNova 6.7 Flash - Lite，同时 SenseNova Token Plan 限时免费开放，全线办公技能 SenseNova - Skills 同步在 GitHub 开源。

现在登录 https://www.sensenova.cn/ 即可领取每 5 小时 1500 次免费额度，让智能办公更快、更好、更省。

下面我们来扒一扒商汤这次发布都透露了哪些重点——

SenseNova 6.7 Flash - Lite：专为“工作流”而生，Token 消耗降 60%

传统智能体模型采用“语言 + 视觉”拼接设计，通常将视觉只作为文本的补充，无法深度参与核心决策与推理循环。这导致信息在“转译”过程中受损，且伴随着高昂的 Token 消耗。

SenseNova 6.7 Flash - Lite 彻底改变了这一链路，它专为“真实世界工作流”而生，采用原生多模态架构，能够像人类一样，直接“看懂”复杂的网页布局、文档结构与财务图表，实现“看、想、做”一体化，可大幅提升数据分析、深度调研、PPT 生成等长链路复杂任务的成功率。

同时在取消了视觉转文本中间层后，它能以更小的参数量，实现智能体能力的跨越式提升，在权威智能体基准测试中取得同级别多项 SOTA。它还可大幅降低推理过程中的 Token 消耗，在信息搜索等场景中 Token 消耗对比纯文本智能体直降 60%，并可实现毫秒级反馈，更符合高频互动的生产环境需求。

SenseNova 6.7 Flash - Lite 技术详情：https://github.com/OpenSenseNova/SenseNova6.7

限时免费，SenseNova Token Plan 来了！

SenseNova Token Plan 正式发布，并同步开启 Token Plan 限时免费活动。开发者首月可享受每 5 小时 1500 次调用额度的无门槛调用配额，零成本解锁极速 AI 体验。

SenseNova Token Plan 是由商汤领先的模型能力深度驱动的：

全线办公技能（SenseNova - Skills）：全面接入 SenseNova - Skills 系列办公技能，从容应对海量数据分析、自动化办公等实战场景。
SenseNova 6.7 Flash - Lite：具备顶尖的 Agent 能力，专为复杂数据分析与任务规划而生，能够完美适配高频、高并发的生产级办公需求。
SenseNova U1 Fast：基于 SenseNova U1 的加速版本，专供信息图（Infographics）生成。

商汤通过更高效的精选模型组合、更富裕的 Token 用量保障，彻底解决开发者与企业用户的成本焦虑，让“长任务”也能“放心跑”，确保项目稳健运行。

立即申请：访问 https://www.sensenova.cn/ 申请限时免费使用。未来还将推出 Lite、Pro 等更多档位，适配从个人创作者到大型企业的多元化需求。

开箱即用：无需复杂配置，开发者可快速接入专业的办公 AI 技能，实现敏捷开发。

配合 SenseNova - Skills，一键开启全自动办公

要实现完整的工作流，离不开“智能体框架”与“专业技能（Skills）”的深度协同。目前，商汤已将日日新 SenseNova 系列模型的核心能力封装为 SenseNova - Skills。这些技能涵盖了信息图生成、PPT 创作、数据分析及深度调研等高频办公场景，并原生支持 OpenClaw、Hermes Agent 等智能体框架。用户既可以根据需求独立调用，也能将其组合成端到端的复杂工作流。

如何快速构建您的智能体？

推荐路径（一键部署）：使用 Agent Pack 安装包 https://github.com/OpenSenseNova/agent_pack 。它集成了 Hermes Agent 或 OpenClaw 框架及全套 Skills 插件，配合 SenseNova 平台的免费 Token Plan 套餐，即可实现开箱即用。
自主集成（灵活扩展）：若使用其他 Agent 框架，可直接从 https://github.com/OpenSenseNova/SenseNova - Skills 获取所需的 Skills 组件并自行安装。

实战案例：从数据洞察到专业交付

SenseNova 6.7 Flash - Lite 不止能推理，更擅长产出高质量的“交付物”，它能实现从复杂文档解析到结构化产出的全流程闭环。

案例一：某连锁企业 36 个月、90 万行销售数据分析
面对某大型蔬菜企业连续 3 年、近 90 万行销售记录，SenseNova 6.7 Flash - Lite 遵照 “数据处理 → 数据分析 → 可视化设计 → 结论总结 → 优化建议” 的链路进行完整分析，并输出企业运营数据分析与决策支持报告。在复杂任务中，展现了极强的逻辑推演与纠错能力：
- 深度思考与观察：模型并非直接跳入统计，而是先进行“数据审计”。它敏锐地察觉到销售单价中存在的异常离群值。通过思考，模型判断这些极值并非错误，而是对应了特定的促销或高端单品场景，因此决定予以保留以反映真实市场波动。
- 多维探寻：在分析毛利时，模型发现辣椒类在 2022 年 5 月出现了严重负毛利。基于此观察，模型进一步探寻供应链环节，最终诊断出是因为“采购成本控制与零售定价间缺乏联动机制”。
- 闭环交付：基于上述洞察，模型主动提出了“建立动态定价机制”和“调整品类结构”等五项精准建议，直接辅助管理层决策。
案例二：具身智能行业调研报告
在深度调研任务中，SenseNova 6.7 Flash - Lite 通过全链路自主编排，独立完成了一份长达 8 个章节的垂直行业现状市场调研报告：
- 从宏观到微观的思考：模型首先定义了 2025 - 2026 年为“商业化元年”这一核心判断。为了验证这一观点，它自主检索并对比了国内外主流厂商（如 AGIBOT、Tesla、Unitree 等）的最新产品线与出货量数据。
- 抗噪环境感知：面对海量的市场杂讯，模型准确提取出“人形机器人整机市场同比增长”及“核心零部件国产化率”等关键逻辑。
- 可视化延伸：基于对成本结构的观察，模型自动生成了直观的饼图与产业链结构图，将枯燥的数据转化为易读的专业交付物。
案例三：医院就诊全流程指引
针对“数字鸿沟”下的特定人群需求，模型的原生多模态架构，帮助完成从叙事逻辑到版面设计的全自动内容生成，产出发布级的医院就诊全流程指南：
- 用户意图锁定：模型深刻理解了“老年人与青少年”作为受众的特殊性，在思考框架时，优先选择了“温暖指引”的叙事基调。
- 跨模态元素对齐：模型不仅生成了清晰的就诊六大流程（挂号、分诊、问诊等），还针对每个环节匹配了高度一致的视觉元素。例如在“智能导引”页面，模型自动配置了“自助挂号机”与“导诊咨询台”的插画对比，极大地降低了读者的理解门槛。
- 稳定交付：在 10 页的 PPT 生成中，模型始终保持风格统一、元素对齐，真正做到了“生成即交付”，且支持用户后续根据具体院情进行二次微调。

赋能全场景，开箱即用

SenseNova 6.7 Flash - Lite 现已支持金融、制造、医疗、教育等全行业核心工作流。它具备五大核心能力，为真实场景工作流带来更高的可靠性与执行稳定性，重新定义轻量化多模态智能体模型。

动态行动决策：系统精准评估推演深度与执行效率，在确保任务完备的前提下，选择最优动作执行时机。
工具链自主编排：面对复杂业务工具链，模型自主规划调用顺序、配置参数，实现多工具间的平滑衔接。
抗噪环境感知：从模糊、不完整或含噪的信息源中，快速提取任务关键逻辑，构建清晰任务认知。
自主纠错与恢复：执行中若出现偏差，实时识别并诊断问题根源，主动修正执行方案，确保任务目标不偏离。
长时序记忆一致性：在超长轮次、多工序任务链中，持续锁定用户的初始意图，避免上下文遗忘。

如何快速接入？

办公小浣熊：如果希望免配置直接使用，可通过 office.xiaohuanxiong.com 免费体验。
智能体技能集 SenseNova - Skills：覆盖各类高频办公场景的 SenseNova Skills 已在 GitHub 开源 https://github.com/OpenSenseNova/SenseNova - Skills/。
开发者支持：模型兼容 OpenAI API，支持平滑接入主流 Agent 框架。

查看全文

http://www.jsqmd.com/news/780052/