当前位置: 首页 > news >正文

腾讯云智能体开发平台RAG模型商业化倒计时 核心功能12月10日起正式计费

腾讯云官方今日发布重要公告,宣布旗下智能体开发平台中的【RAG模型】服务即将结束体验阶段,将于2025年12月10日20时起正式启动商业化计费。这一调整标志着腾讯云在企业级AI应用服务领域的商业化进程迈出关键一步,也为依赖该平台构建智能应用的开发者带来新的成本规划考量。

【免费下载链接】Youtu-Embedding项目地址: https://ai.gitcode.com/tencent_hunyuan/Youtu-Embedding

商业化覆盖范围明确 RAG核心组件纳入计费体系

公告明确指出,本次商业化涉及的RAG模型体系包含文档解析、文档拆分、rerank、embedding、TEXT2SQL及多轮改写模型等核心功能模块。但首轮计费范围将聚焦于智能体开发平台内置的四类关键模型:youtu-reranker、youtu-reranker-llm、youtu-embedding和youtu-embedding-llm。这四类模型作为RAG(检索增强生成)技术架构的核心引擎,承担着知识检索的精准度优化与语义理解的关键作用,其性能直接影响智能问答、数据分析等应用场景的响应质量。

据技术文档显示,embedding模型负责将非结构化文本转化为高维向量实现语义索引,而rerank模型则通过深度排序算法提升检索结果相关性,两者构成智能知识检索的"双引擎"。此次计费调整将这两类基础能力模块单独定价,体现出腾讯云对AI基础设施分模块商业化的战略布局。

多场景计费规则细化 知识检索API先行收费

针对不同开发模式下的服务使用场景,腾讯云详细界定了计费适用范围。公告特别强调,本次商业化初期仅对"知识检索API调用场景"实施收费,其他应用场景仍保持体验政策,具体收费时间将另行通知。这一梯度收费策略为开发者提供了缓冲期,有助于企业根据自身业务优先级逐步调整技术架构。

在标准模式下,当应用通过知识库问答功能触发检索操作,或在工作流中调用知识检索/大模型知识问答节点时,系统将自动启用embedding与rerank模型。单工作流模式中,除知识检索节点外,数据库TEXT2SQL插件的使用也将触发相关模型调用。而在复杂的Multi-Agent模式下,知识库问答、数据库TEXT2SQL及知识检索三大类插件的调用均纳入计费监测范围。值得注意的是,知识检索API作为独立服务接口,其所有调用行为将全面纳入本次计费体系。

后付费模式正式启用 账户配置需提前完成

腾讯云为RAG模型商业化提供了灵活的后付费计费模式,用户需在2025年12月3日产品功能更新后,通过平台管理界面的"计费资源清单-后付费设置"路径,手动开启"应用服务_RAG模型后付费"开关。官方建议开发者在12月4日至9日期间完成配置,以确保服务连续性。

公告特别提醒,若用户未在12月10日前完成后付费设置,相关RAG功能将自动停用。对于已开启服务的用户,需保持账户余额充足,避免因欠费导致服务中断。这一机制要求企业用户重新评估AI服务的成本结构,建立相应的预算管理流程。

过渡期应对建议 开发者需做好技术与财务双重准备

面对服务调整,腾讯云建议暂无付费计划的用户及时评估替代方案,确保业务连续性不受影响。行业分析师指出,此次商业化调整可能加速智能应用开发领域的技术选型分化,具备自主研发能力的大型企业或将转向混合云部署策略,而中小开发者则可能更倾向于优化现有应用架构,减少不必要的模型调用。

公告同时承诺,用户在使用过程中遇到的技术问题可通过工单系统获得支持。作为国内领先的云服务提供商,腾讯云此举既是对AI技术研发成本的合理回收,也体现了其推动生成式AI技术标准化、商业化的决心。随着RAG模型商业化进程的推进,国内AI服务市场的定价体系与服务模式有望迎来新一轮规范化发展。

此次调整距离正式计费尚有一周准备期,建议相关企业用户尽快完成账户检查、成本测算与技术评估工作,以平滑过渡至商业化服务阶段。腾讯云方面尚未公布具体的计费单价,相关信息将在后续的计费概述文档中详细披露。

【免费下载链接】Youtu-Embedding项目地址: https://ai.gitcode.com/tencent_hunyuan/Youtu-Embedding

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/84901/

相关文章:

  • 小米开源MiDashengLM-7B声音大模型:22项测评登顶SOTA,推理效率提升4倍
  • iTerm2 美化
  • HunyuanImage-GGUF模型部署全攻略:从基础配置到轻量化实践
  • 生成PPT的提示词模版
  • 国外好软件,但切勿非法使用,否则后果自负!
  • 开源音频AI里程碑:Liquid AI发布LFM2-Audio模型,15亿参数实现全场景端侧语音交互
  • 每日一题Day09-划分字母区间
  • 【面板数据】全球稀土贸易数据(2018-2024年)
  • 改善深层神经网络 第一周:深度学习的实践(三)dropout
  • OpenHarmony与ArkUI-X的AtomGit_Pocket详细版
  • ensp vlan实验作业
  • 文本指令驱动视频创作革命:Lucy Edit AI开源模型重塑内容生产范式
  • 终极游戏控制器虚拟化:3步解决跨平台兼容难题
  • 22、PHP编程:内置函数与MySQL交互全解析
  • 23、PHP编程与相关技术全解析
  • Nginx NIO对比Java NIO
  • 44、SQL Server 与 PostgreSQL 的对比及迁移指南
  • 腾讯混元开源POINTS-Reader:轻量化视觉语言模型重塑文档转换效率新标杆
  • OpenHarmony与ArkUI-X的AtomGit_Pocket速通版
  • 45、SQL Server 迁移与容器化应用指南
  • 46、使用容器更新和管理 SQL Server:全面指南
  • 边缘AI新突破:Liquid AI发布LFM2混合模型,重新定义设备端智能体验
  • k8s某pod节点资源使用率过高,如何调整
  • 39、SQL Server管理与监控全解析
  • 腾讯混元SRPO技术突破:FLUX模型真实感提升372%,开创文本图像生成新范式
  • 40、SQL Server 管理、监控、故障排除与迁移指南
  • 24、网页开发技术综合解析
  • ServiceNow发布轻量化多模态模型Apriel-1.5-15b-Thinker,15B参数实现企业级推理能力
  • 惯导姿态解算中的一下实际问题1(附姿态解算相关的C、matlab代码)
  • 计算机毕业设计必看必学~ 基于SSM的大学生就业平台的设计与实现85751,原创定制程序、单片机、java、PHP、Python、小程序、文案全套、毕设成品等!