当前位置: 首页 > news >正文

大模型常见的专用名词

• RPM(Requests Per Minute):每分钟最多允许发起多少次请求(调用次数)。超过就会报限流。  • TPM(Tokens Per Minute):每分钟最多允许处理多少 token。token 可以理解为“文本计费单位/处理单位”(中英文拆分规则不同)。  • 重要:有的厂商 TPM只算输入 tokens,有的会把 输入+输出 都算进去;要以你用的厂商文档为准。  • RPD(Requests Per Day):每天(或滚动 24h)最多允许多少次请求。 
  1. Token & 上下文相关
    • Token:模型处理文本的基本单位;不是“字数”,中文/英文的 token 数差异很大。
    • Context window / Context length(上下文窗口):一次请求里模型能“看到”的最大 token 数(输入+输出通常都占用窗口)。
    • Input tokens / Output tokens:输入消耗的 token、输出生成消耗的 token。
    • Max output tokens / max_tokens:这次最多允许模型生成多少 token(防止无限输出)。
    • Truncation(截断):输入太长时被系统或你自己截断,导致模型“看不到后半段”。

  2. 限流 / 吞吐相关
    • RPS / QPS(Requests/Queries Per Second):每秒请求数(有时平台会用这个口径,而不是 RPM)。
    • Burst(突发):短时间允许你“瞬时冲高”,但会用更长窗口做平滑统计(常见于滚动窗口策略)。
    • Rolling window(滚动窗口):不是按整点清零,而是按“最近 60 秒 / 最近 24 小时”累计来算;所以你会看到“请在 X 分钟后重试”这种提示。 
    • Concurrency(并发):同时在跑的请求数量上限(有的平台单独限制并发)。
    • Throughput(吞吐):单位时间输出多少 token(tokens/s),和模型大小、推理硬件、解码策略有关。
    • Latency(延迟):从发请求到拿到响应的时间;常拆成 TTFT + 生成阶段。

  3. 流式与时延拆分
    • Streaming(流式输出):模型边生成边返回(更“快看到第一段”)。
    • TTFT(Time To First Token):首 token 返回时间;对体验影响非常大。
    • Tokens/s(生成速度):流式时更直观。

  4. 计费与配额混合口径(不同厂商差异更大)
    • TPD(Tokens Per Day):每天 token 总量限制(有些平台有)。 
    • Spend limit(消费上限):按金额限制(例如 Anthropic/Claude 文档里会区分消费上限和速率限制)。 
    • Cached tokens(缓存 token):有的平台对“命中缓存”的 token 不计入限额或计费(具体看平台规则)。 
    • 音频类配额:例如按 Audio seconds per hour/day 计(做语音模型常见)。 

http://www.jsqmd.com/news/217678/

相关文章:

  • pycharm一运行就是test怎么改
  • 同步互斥机制和编程方法
  • 程序员必读:2026年AI智能体趋势,收藏这篇抢占先机
  • Windows 系统版本转换工具,一键互转不用重装
  • 大数据领域数据治理的质量提升秘籍
  • 深入理解 MCP,非常详细收藏我这一篇就够了
  • 大模型Agent架构演进:从临时拼接到按需组合的微应用之路(程序员必收藏)
  • AI产品经理与大模型学习全攻略:从入门到精通,零基础也能掌握AI思维
  • 根据算法题目时间限制推算时间复杂度限制
  • AI大模型学习路线:从入门到高薪,程序员收藏必备!2025年AI就业薪资表曝光
  • FPGA应用开发和仿真【3.7】
  • 每日Java面试场景题知识点之-ELK技术栈实战应用
  • 【毕业设计】SpringBoot+Vue+MySQL “衣依”服装销售平台平台源码+数据库+论文+部署文档
  • 每日Java面试场景题知识点之-ELK日志分析
  • FPGA应用开发和仿真【3.8】
  • FPGA应用开发和仿真【3.6】
  • 从零到AIGC产品经理,2个月上岸全攻略,小白也能学会
  • 收藏这篇!小白也能学会的AI知识库搭建全攻略
  • 国内首次开源灵巧操作数据集!填补具身智能数据空白!
  • Java Web 墙绘产品展示交易平台系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • 什么是proxy
  • 收藏这篇就够了!DeepSeek+RAG本地知识库搭建实战,小白也能上手的大模型教程
  • Web足球青训俱乐部管理后台系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • AI Agent短期记忆完全指南:4种处理长对话问题的方法+代码详解
  • 解耦梯度学习解决多模态模型欠优化问题,性能提升超3%
  • 2026AI产品经理与大模型学习路线图:从小白到专家的进阶指南
  • 大模型+知识图谱构建制药业“第二大脑“:从零开始实现企业级知识管理
  • 深入了解移动开发领域 CI_CD 的工作原理
  • 打造AI时代智能知识库:Obsidian+Dify向量检索全攻略(附插件下载)
  • Claude Code完美平替OpenCode:小白也能轻松上手的AI编程神器