当前位置: 首页 > news >正文

AI开发-python-langchain框架(1-8-1 缓存机制——让 AI 应用“记住”高频问题)

想象一下,你现在是一家大型电商平台的AI架构师。双十一期间,你的智能客服系统每天要处理千万级的用户咨询。每个问题都要调用昂贵的GPT-API,响应慢、成本高,用户投诉飙升……这时候,你会怎么做?"

"我们会发现一个奇怪的现象——每天有30%的问题是完全相同的!用户都在问:'快递几天能到?'、'怎么退货?'、'商品有保修吗?'……每个问题都要调用GPT-4,每次花费0.03美元,一天就是数万美元!更糟的是,相同的回答,用户要等3-5秒才能看到……"

解决方案:引入缓存机制(如下使用sqlite当缓存数据库),当用户问道相同问题时,从缓存里直接给出答案不用将问题在送给大模型,既节约金钱成本也节约时间成本。

直接看代码:

from langchain_community.cache import SQLiteCache
from langchain.globals import set_llm_cache
from langchain_openai import ChatOpenAI
import os#指定缓存 对比提问同样的问题,返回时间
set_llm_cache(SQLiteCache(database_path="langchain_demo.db"))llm = ChatOpenAI(api_key=os.getenv("DEEPSEEK_API_KEY"),base_url=os.getenv("DEEP_URL"),  # Deepseek 的 API 基础地址model="deepseek-v3:671b",  # Deepseek 对话模型(可选:deepseek-chat-pro 等高级模型)temperature=0.7,  # 温度参数(0-1,越低越稳定)max_tokens=1024  # 最大生成 tokens
)#这时会向数据库里插入一条数据
response =llm.invoke("hello world")
print(response.content)#再插入一条数据 注:是否插入要根据提示词和调用的模型(模型参数改变也会认为是不同)
response =llm.invoke("how are you")
print(response.content)#这时就会从缓存里直接出结果不会送往大模型,数据库里也不会新插入一条数据
response =llm.invoke("hello world")
print(response.content)

 运行结果:可以看到 第一次的回答和第三次的回答是完全一样的。

Hello! 🌍 How can I assist you today? Whether you have questions, need help with a task, or just want to chat, I'm here for you! 😊Hey there! Thanks for asking! I'm functioning at full capacity and ready to help you out. While I don't experience feelings in the way humans do, I genuinely enjoy our conversations and am always excited to learn and assist. How can I support you today? I'm all ears! 🌟Hello! 🌍 How can I assist you today? Whether you have questions, need help with a task, or just want to chat, I'm here for you! 😊

 

 

 我们可以看到,虽然我么提问了三次问题,但是缓存数据库里只有两条数据,说明第三次提问,回答是从缓存里走的。

图片

 

http://www.jsqmd.com/news/321081/

相关文章:

  • 携程任我行礼品卡回收(方法、流程、折扣)
  • 好写作AI:教育学研究论文的质性数据AI编码与解读实践
  • 2026最新专精特新企业认定服务推荐!创新型企业资质认定权威指南,专业服务助力常州企业高质量发展
  • 2026年修表店推荐:多场景维修排名,解决名表保养与智能手表修复痛点
  • 运维系列python系列【亲测有效】:AttributeError: ‘str‘ object has no attribute ‘decode‘--django中的mysql问题
  • 2026最新高新技术成果转化认证服务推荐!权威机构助力科技型企业价值提升,合规高效申报解决方案
  • 2026年名表维修推荐:基于多品牌复杂机芯修复实测评价,针对技术可靠性核心痛点精准指南
  • 好写作AI:AI辅助写作的透明度标准——如何标注“人机协作”贡献
  • 2026年修表店推荐:基于长期跟踪实地评价,涵盖应急维修与日常保养多场景
  • 2026年修手表推荐:办公通勤场景深度评测,解决走时不准与进水痛点并附服务排名
  • canvas画饼图教程,手把手教你绘制与添加标签
  • MindSpore 进阶:在 Ascend NPU 上构建高效的自定义训练步 (TrainOneStep)
  • 2026石化设备制造优选,这些厂家实力出众,蒸汽锅炉/锅炉厂家/导热油锅炉,石化设备定制厂家推荐
  • 2026最新研发费用加计扣除服务推荐!江浙沪科技企业专业财税规划机构权威榜单发布,助力企业合规降本增效
  • 基于模态分析的压缩机冷凝管道关键尺寸优化设计(任务书)
  • 2026年钟表维修服务网点推荐与评价:解决真假难辨与高价陷阱痛点,附全国中心站排名
  • 2026最新技术合同服务推荐!江浙沪科技型企业合规合作首选,专业技术合同咨询/认定登记服务机构推荐
  • 2026年名表维修服务网点权威测评报告:基于百家客户匿名反馈的口碑深度解析
  • 【2026-01-29】起床闹剧
  • 2026网络安全行业深度解析:前景、入行路径与系统学习指南
  • STATA 学习
  • ElasticSearch9.2单节点部署
  • 突破规模极限:AI前沿五大颠覆性技术洞察
  • Gitee:本土化技术生态如何重塑中国开发者协作范式
  • 好写作AI:法学论文中案例检索与逻辑链生成的智能辅助
  • 上海靠谱的护肤品费用多少,有性价比高的推荐吗?
  • 网络安全怎么入门?零基础看这一篇就够了!
  • 流量分析进阶(一):RCTF2025-Shadows of Asgard - 教程
  • 售后完善的AI智能办公鼠标价格多少,南方网通费用高吗
  • 2026年Apple Watch苹果手表维修中心推荐:基于紧急与日常场景深度评测与排名