当前位置: 首页 > news >正文

模型路由与提示预处理:控制大语言模型成本、提升令牌使用效果的新方法!

大语言模型使用成本问题凸显

并非所有提示都是相同的。通过将简单的提示路由到更便宜的模型,能在令牌成本上节省一大笔钱。图片来源:Shutterstock Gen AI

作为资深的 Delphi 开发者,对当年和 Visual Basic 开发者之间的“语言战争”记忆犹新。Delphi 早期代号是“VBK”,即“VB 杀手”,这引起 VB 社区不满,他们会到 Delphi 论坛挑起争端,而 Delphi 开发者也会反击,引发激烈口水战。那些日子令人怀念。

如今,讨论更上层次——哪种模型更适合用于编码?虽现在争论没当年 VB 和 Delphi 之争激烈,但大家各有看法。企业在为团队选择模型前,会对不同模型进行评估,大多数团队已选定常用的一系列模型。

有时,与 Claude 或 Codex 聊天体验欠佳。不久后,像 GStack 和 Superpowers 这样的脚手架工具开始为与大语言模型(LLM)交互提供基础支持,即在提示到达模型本身之前,对其进行基本处理。这些工具有助于建立有用的上下文,就像在“原始提示”之上增加一层。上下文工程是在聊天界面之上添加的第一层,也是最常见的一层。

选定模型和工具后,大家追求令牌使用最大化。但账单寄来时,管理者不高兴了。随着成本飙升,领导层担心钱没花在刀刃上。

模型路由:下一层解决方案

就像汇编语言和手动调整寄存器被编译器和结构化语言取代,进而发展出框架和库,最近又出现大语言模型和提示工程一样,开发者和管理者开始意识到,有更好方法管理大语言模型使用成本。但自然地,刚弄清楚事情运作方式,新的一层就会出现,让辛苦积累的知识过时。显然,仅能用英语编写代码不足以阻止下一次抽象出现。所以,又一层抽象出现了。(世事皆如此。)因此,模型路由成为让每一分令牌成本都发挥最大价值的最新方法。

其理念是,并非所有提示都需要同等处理能力。向 Claude 提出的问题,并非都需要前沿模型深度思考。模型路由器可以分析提示内容,决定哪个模型最适合回答该提示,并将查询导向该模型。也许简单请求更适合用旧模型处理,也许代码审查用专门为此设计的模型效果更好。模型路由可以提高令牌使用效率。如今使用 Claude Code 时,必须为整个会话选择一个模型,若想用顶级模型,无论最终做什么都得为此付费。而模型路由器可以让灵活选择模型,从而控制成本。像 Coinbase 这样的公司,在令牌使用量增加的同时,AI 支出却减少了一半。

从令牌最大化到令牌匹配

大语言模型不断发展,功能越来越强大,也越来越专业化。将提示路由到既适合任务又具有成本效益的模型,是提高令牌使用效果的关键。目前,团队是手动进行这项工作的,但未来,人工智能本身将成为做出此类决策的最佳方式。例如,Claude Code Router 可以根据每个提示所需的工作类型,将其路由到多个流行模型中的任意一个,而且它是开源的。

接下来出现的将是提示预处理。可以努力编写好的提示,但人工智能本身可以对提问进行优化。提示工程中最好的技巧之一,就是告诉大语言模型“提出我没问但应该问的问题”。不难想象,未来写出一个提示,人工智能会帮助澄清、完善它,然后将其路由到最合适、最具成本效益的模型来获取答案。将不再需要选择特定的大语言模型提供商,而是可以专注于明确表达自己的需求。所以,别再为特定模型手工编写提示了,让即将出现的模型路由器和提示预处理器为完成这些繁琐的工作吧。人工智能、开发工具、生成式 AI、软件开发该何去何从呢?

http://www.jsqmd.com/news/1116986/

相关文章:

  • Bifrost:三星固件下载的终极解决方案,跨平台免费工具全攻略
  • 保障用电安全,电能质量监测该用在何处?
  • 英伟达RTX Spark超级芯片深度解析:AI PC如何重塑个人计算与工作流
  • 选安全净水器,顾家是答案
  • # XLua WinForm桌面环境部署与运行说明本次完成了原生XLua在VS2022 WinForm桌面程序的完整部署与功能验证,全程解决编译、库加载、类型兼容三类核心问题。首先通过CMake编译
  • SnapLogic 推出 MCP Builder:无需代码,加速企业 AI 应用落地!
  • Prompt Engineering在AI Agent中的高级技巧:从Chain-of-Thought到Tree-of-Thought
  • GPT工程能力全景图谱:场景映射、标准化工作流与落地实战指南
  • RoPE 与 ALiBi:位置编码的两种革命性范式
  • 3步实战:如何让《艾尔登法环》在高端硬件上释放全部潜能
  • 佳能G6080报错5b00维修历程,开始把打印机抱到维修店,维修师傅说修好大概180元,我觉得实在太贵了就没有必要维修了,买一台新的算了,准备买新的时候朋友推荐用佳能V6.200佳能清零软件,最终修好
  • 第17章:Dify 分层架构与 DDD 设计深度解析
  • Mac视频预览终极解决方案:让Finder直接播放MKV、AVI等所有格式视频
  • 华硕笔记本性能调优终极指南:如何用GHelper取代臃肿的Armoury Crate
  • 解决Turbo Intruder插件兼容性问题:升级Burp Suite实战指南
  • 中国顶尖AI大模型的四大硬核判断标准
  • gsplat安装与使用指南:高效实现3D高斯溅射渲染
  • OpenClaw移动端安装部署实战:local-first架构实测与Cursor云端方案全对比
  • 零基础 Vibe Coding 教程 MCP 服务介绍 50
  • 高并发实战:C#工控机实现100+设备Modbus TCP并发采集,性能优化到毫秒级响应
  • 户外LED广告牌防雷设计:接地方案与SPD安装
  • 第16章:【基础篇综合实战】搭建企业级智能客服系统
  • 壁炉科普|冬季壁炉偶尔倒烟、冒烟?原因和一次性解决方法
  • SpringBoot全局XSS防御实战:5分钟集成过滤器实现请求参数净化
  • 第 12 篇|项目整合与打包发布 —— 从 Demo 到可安装 APK 的完整收官指南
  • 一个周末完成数月工作量!借助 AI 反击网站垃圾注册攻击,成本低效果好
  • AI抗衰药物研发公司「无尽方舟」获数千万元种子轮融资,跨物种AI平台优势凸显
  • RTSPtoWeb终极指南:3分钟实现摄像头视频网页直播的完整方案
  • 迭代法求从根到叶的二进制数之和
  • XSS攻击深度解析:从原理到企业级防御实战