当前位置: 首页 > news >正文

商汤推新一代轻量化模型,Token 消耗降 60%,多场景实战表现亮眼!

商汤推出新一代轻量化多模态智能体模型,Token 消耗降 60%,多场景实战表现亮眼!

今天,商汤正式推出新一代轻量化多模态智能体模型——商汤日日新 SenseNova 6.7 Flash - Lite,同时 SenseNova Token Plan 限时免费开放,全线办公技能 SenseNova - Skills 同步在 GitHub 开源。

现在登录 https://www.sensenova.cn/ 即可领取每 5 小时 1500 次免费额度,让智能办公更快、更好、更省。

下面我们来扒一扒商汤这次发布都透露了哪些重点——

SenseNova 6.7 Flash - Lite:专为“工作流”而生,Token 消耗降 60%

传统智能体模型采用“语言 + 视觉”拼接设计,通常将视觉只作为文本的补充,无法深度参与核心决策与推理循环。这导致信息在“转译”过程中受损,且伴随着高昂的 Token 消耗。

SenseNova 6.7 Flash - Lite 彻底改变了这一链路,它专为“真实世界工作流”而生,采用原生多模态架构,能够像人类一样,直接“看懂”复杂的网页布局、文档结构与财务图表,实现“看、想、做”一体化,可大幅提升数据分析、深度调研、PPT 生成等长链路复杂任务的成功率。

同时在取消了视觉转文本中间层后,它能以更小的参数量,实现智能体能力的跨越式提升,在权威智能体基准测试中取得同级别多项 SOTA。它还可大幅降低推理过程中的 Token 消耗,在信息搜索等场景中 Token 消耗对比纯文本智能体直降 60%,并可实现毫秒级反馈,更符合高频互动的生产环境需求。

SenseNova 6.7 Flash - Lite 技术详情:https://github.com/OpenSenseNova/SenseNova6.7

限时免费,SenseNova Token Plan 来了!

SenseNova Token Plan 正式发布,并同步开启 Token Plan 限时免费活动。开发者首月可享受每 5 小时 1500 次调用额度的无门槛调用配额,零成本解锁极速 AI 体验。

SenseNova Token Plan 是由商汤领先的模型能力深度驱动的:

  • 全线办公技能(SenseNova - Skills):全面接入 SenseNova - Skills 系列办公技能,从容应对海量数据分析、自动化办公等实战场景。
  • SenseNova 6.7 Flash - Lite:具备顶尖的 Agent 能力,专为复杂数据分析与任务规划而生,能够完美适配高频、高并发的生产级办公需求。
  • SenseNova U1 Fast:基于 SenseNova U1 的加速版本,专供信息图(Infographics)生成。

商汤通过更高效的精选模型组合、更富裕的 Token 用量保障,彻底解决开发者与企业用户的成本焦虑,让“长任务”也能“放心跑”,确保项目稳健运行。

立即申请:访问 https://www.sensenova.cn/ 申请限时免费使用。未来还将推出 Lite、Pro 等更多档位,适配从个人创作者到大型企业的多元化需求。

开箱即用:无需复杂配置,开发者可快速接入专业的办公 AI 技能,实现敏捷开发。

配合 SenseNova - Skills,一键开启全自动办公

要实现完整的工作流,离不开“智能体框架”与“专业技能(Skills)”的深度协同。目前,商汤已将日日新 SenseNova 系列模型的核心能力封装为 SenseNova - Skills。这些技能涵盖了信息图生成、PPT 创作、数据分析及深度调研等高频办公场景,并原生支持 OpenClaw、Hermes Agent 等智能体框架。用户既可以根据需求独立调用,也能将其组合成端到端的复杂工作流。

如何快速构建您的智能体?

  • 推荐路径(一键部署):使用 Agent Pack 安装包 https://github.com/OpenSenseNova/agent_pack 。它集成了 Hermes Agent 或 OpenClaw 框架及全套 Skills 插件,配合 SenseNova 平台的免费 Token Plan 套餐,即可实现开箱即用。
  • 自主集成(灵活扩展):若使用其他 Agent 框架,可直接从 https://github.com/OpenSenseNova/SenseNova - Skills 获取所需的 Skills 组件并自行安装。

实战案例:从数据洞察到专业交付

SenseNova 6.7 Flash - Lite 不止能推理,更擅长产出高质量的“交付物”,它能实现从复杂文档解析到结构化产出的全流程闭环。

  • 案例一:某连锁企业 36 个月、90 万行销售数据分析

    面对某大型蔬菜企业连续 3 年、近 90 万行销售记录,SenseNova 6.7 Flash - Lite 遵照 “数据处理 → 数据分析 → 可视化设计 → 结论总结 → 优化建议” 的链路进行完整分析,并输出企业运营数据分析与决策支持报告。在复杂任务中,展现了极强的逻辑推演与纠错能力:

    • 深度思考与观察:模型并非直接跳入统计,而是先进行“数据审计”。它敏锐地察觉到销售单价中存在的异常离群值。通过思考,模型判断这些极值并非错误,而是对应了特定的促销或高端单品场景,因此决定予以保留以反映真实市场波动。
    • 多维探寻:在分析毛利时,模型发现辣椒类在 2022 年 5 月出现了严重负毛利。基于此观察,模型进一步探寻供应链环节,最终诊断出是因为“采购成本控制与零售定价间缺乏联动机制”。
    • 闭环交付:基于上述洞察,模型主动提出了“建立动态定价机制”和“调整品类结构”等五项精准建议,直接辅助管理层决策。
  • 案例二:具身智能行业调研报告

    在深度调研任务中,SenseNova 6.7 Flash - Lite 通过全链路自主编排,独立完成了一份长达 8 个章节的垂直行业现状市场调研报告:

    • 从宏观到微观的思考:模型首先定义了 2025 - 2026 年为“商业化元年”这一核心判断。为了验证这一观点,它自主检索并对比了国内外主流厂商(如 AGIBOT、Tesla、Unitree 等)的最新产品线与出货量数据。
    • 抗噪环境感知:面对海量的市场杂讯,模型准确提取出“人形机器人整机市场同比增长”及“核心零部件国产化率”等关键逻辑。
    • 可视化延伸:基于对成本结构的观察,模型自动生成了直观的饼图与产业链结构图,将枯燥的数据转化为易读的专业交付物。
  • 案例三:医院就诊全流程指引

    针对“数字鸿沟”下的特定人群需求,模型的原生多模态架构,帮助完成从叙事逻辑到版面设计的全自动内容生成,产出发布级的医院就诊全流程指南:

    • 用户意图锁定:模型深刻理解了“老年人与青少年”作为受众的特殊性,在思考框架时,优先选择了“温暖指引”的叙事基调。
    • 跨模态元素对齐:模型不仅生成了清晰的就诊六大流程(挂号、分诊、问诊等),还针对每个环节匹配了高度一致的视觉元素。例如在“智能导引”页面,模型自动配置了“自助挂号机”与“导诊咨询台”的插画对比,极大地降低了读者的理解门槛。
    • 稳定交付:在 10 页的 PPT 生成中,模型始终保持风格统一、元素对齐,真正做到了“生成即交付”,且支持用户后续根据具体院情进行二次微调。

赋能全场景,开箱即用

SenseNova 6.7 Flash - Lite 现已支持金融、制造、医疗、教育等全行业核心工作流。它具备五大核心能力,为真实场景工作流带来更高的可靠性与执行稳定性,重新定义轻量化多模态智能体模型。

  • 动态行动决策:系统精准评估推演深度与执行效率,在确保任务完备的前提下,选择最优动作执行时机。
  • 工具链自主编排:面对复杂业务工具链,模型自主规划调用顺序、配置参数,实现多工具间的平滑衔接。
  • 抗噪环境感知:从模糊、不完整或含噪的信息源中,快速提取任务关键逻辑,构建清晰任务认知。
  • 自主纠错与恢复:执行中若出现偏差,实时识别并诊断问题根源,主动修正执行方案,确保任务目标不偏离。
  • 长时序记忆一致性:在超长轮次、多工序任务链中,持续锁定用户的初始意图,避免上下文遗忘。

如何快速接入?

  • 办公小浣熊:如果希望免配置直接使用,可通过 office.xiaohuanxiong.com 免费体验。
  • 智能体技能集 SenseNova - Skills:覆盖各类高频办公场景的 SenseNova Skills 已在 GitHub 开源 https://github.com/OpenSenseNova/SenseNova - Skills/。
  • 开发者支持:模型兼容 OpenAI API,支持平滑接入主流 Agent 框架。
http://www.jsqmd.com/news/780052/

相关文章:

  • 基于OpenClaw的多智能体编排器:AI Agent协同工作流实战
  • 基于大语言模型的量化策略开发:AI副驾驶如何降低策略实现门槛
  • 2026年4月GitHub热门开源项目榜单:AI智能体正式迈入工业化协作时代
  • 动态电压降分析:技术演进与工程实践
  • Godot引擎AI助手集成指南:提升游戏开发效率的实践方案
  • 端口扫描关键技术研究
  • spring5-velocity
  • JAI Diff Editor:AI代码补丁可视化应用与MCP集成实战
  • MCP Manager:本地AI工具生态的协议适配器与安全网关
  • 本地看视频太寂寞?弹弹play概念版让手机秒变“弹幕影院“!
  • Dify自定义扩展开发指南:构建高可用AI工作流节点
  • RosTofu:将非ROS应用桥接为ROS2节点的完整指南
  • CPU深度学习推理性能优化与AMX指令集实践
  • Arm Neoverse V3AE缓存与TLB调试机制详解
  • 有没有ROS2大手子帮帮我!
  • 储能电站收益优化
  • 成都 H 型钢主流钢厂对比分析 马钢 / 莱钢 / 津西 / 包钢 / 山西晋南哪家强|四川盛世钢联采购参考 - 四川盛世钢联营销中心
  • Cursor AI编程助手深度思考规则:从思维链到工程化实践
  • Windows软件自启速度优化BAT脚本
  • 从 SEO 到 GEO,姚金刚老师开源了他的中文 AI 提示词库,三天在 Github 上狂揽 1300+ Stars!
  • AArch64虚拟内存系统与两级地址转换机制详解
  • 终极指南:3步快速搭建微信网页版免费使用方案
  • 嵌入式软件工程师如何快速熟悉陌生项目的代码
  • 基于Whisper语音识别的reCAPTCHA v2音频挑战本地破解方案
  • 2025最权威的六大降AI率方案实际效果
  • 亚马逊多账号运营选择什么指纹浏览器?说说我的使用体验!
  • 从零构建个人配置管理系统:基于符号链接与Git的dotfiles实践
  • AI Agent技能包:无缝桥接aelf区块链DAO治理与智能工作流
  • Git Worktree Manager:多分支并行开发的高效解决方案
  • Flutter for OpenHarmony 跨平台开发:喝水提醒功能实战指南