当前位置: 首页 > news >正文

Token 会消失吗?个人与企业如何理解 AI 时代的新计算单位

关键词:Token、Byte-level Model、Tokenizer-free、AI 成本、企业治理、算力计量

开篇:Token 可能不是终点

今天我们谈 AI 使用成本,最常听到的一个词是:Token

对个人来说,Token 代表一次提问和回答背后的消耗。
对企业来说,Token 代表 AI 成本、权限、用量、预算和治理。

但一个值得提前思考的问题是:

未来 AI 一定还会继续以 Token 为核心单位吗?

答案是:不一定。

准确地说,Token 在短期内仍然重要,但从技术趋势看,AI 正在出现“去传统 Token 化”的方向。未来企业不能只学会管理 Token,还要学会管理更底层的 AI 计算资源和业务价值。

今天:Token 使用

输入 Token

输出 Token

上下文 Token

未来:多单位并存

Byte

Patch

Latent Chunk

Compute Unit

Task Value

一、今天的 Token 是什么

在主流大模型中,文本通常会被拆成 Token。模型处理输入 Token,再生成输出 Token。

OpenAI 官方帮助文档说明,API 使用中会统计输入 Token、输出 Token、缓存 Token、推理 Token 等,这些统计会用于用量跟踪和计费。

简单理解:

  • 你输入的内容越多,输入 Token 越多
  • AI 输出的内容越长,输出 Token 越多
  • 对话历史越长,上下文 Token 越多
  • 复杂推理越多,内部计算消耗可能越高

一次 AI 调用

输入内容

上下文历史

模型推理

输出内容

输入 Token

上下文 Token

http://www.jsqmd.com/news/805279/

相关文章:

  • 从NAND到SCM:非易失性存储器的技术演进与系统架构变革
  • 跨区域团队协作时对Taotoken服务稳定性的实际依赖体验
  • 创业团队如何利用 Token Plan 套餐控制大模型使用成本
  • 氛围编程实战:用AI工具栈快速构建可部署应用
  • 从‘狼来了’到金融风控:深入浅出聊聊AUC、ROC曲线与平衡精度的实战意义
  • RAG面试8大高频问题深度解析:从入门到实战,助你拿下AI应用开发Offer!
  • 从灾难通信中断看关键基础设施韧性:技术失效背后的系统思考
  • 2025 AI 开源热潮:Kimi K2 万亿参数 MoE 模型正式开源 — SOTA 代码生成 通用 Agentic 任务全方位升级,128K 上下文兼容 OpenAI API
  • Java Web :JDBC CRUD 与前后端交互
  • 破解‘特质波动率之谜’?从Ang的论文到Python复现,一份给金融科技爱好者的实战指南
  • 一文读懂Grok 4发布会:四大天王轮流发版,2026全球AI第一梯队争夺战
  • 手把手教你用Arduino驱动SPL06-007气压传感器(附完整代码与PCB布局避坑指南)
  • Linux环境下Minio部署实战:从零搭建到服务稳定运行
  • 基于AI Agent的智能邮件分诊系统:从原理到开源实践
  • DeepSeek垂直搜索部署避雷手册(含Docker镜像精简方案与GPU显存压缩技巧):仅剩最后237份内部技术白皮书
  • YOLOv5 v6.0架构解析:从Backbone到Head的模块化设计精讲
  • 智能变频恒压供水系统解决方案:节水降耗,推进绿色低碳水务发展
  • 被高价限流逼到半夜改价的夜晚,我用凌风工具箱十分钟批量搞定
  • 这难道是人能够想象出来的赛道吗?
  • 从APB2到APB4:一次读写操作背后,AMBA总线这20年都升级了啥?
  • Taotoken的API Key精细化管理功能助力企业实现访问控制与审计
  • js的复习(一)
  • Qt实战:手把手教你实现QTableView单元格拖拽交换(附完整代码)
  • 大数据没那么远:把散乱数据理顺,让业务敢用
  • 不只是Lab 0:从xv6环境搭建看RISC-V工具链与QEMU模拟器的前世今生
  • Veo与Sora 2视频生成质量深度横评:基于PSNR/SSIM/LPIPS/VMAF 5大专业指标的72小时盲测结果揭晓
  • OpenClaw Telegram机器人自愈系统:从诊断到恢复的自动化运维实践
  • 智能家居AI化:从边缘计算到主动决策
  • 智能APK安装器:在Windows电脑上直接运行Android应用的完整指南
  • EKF神经网络修正储能电站SOC估计【附代码】