当前位置: 首页 > news >正文

Promptfoo的搭建与测试,2026-0521成功版很简单

可能写的有点粗糙,但是我搞通了,有不懂的可以问我,懒得再更新了

其实我也是520当天搭建好的,现在的教程也不多,我就搜了搜,没什么具体的步骤,我想用windows感觉更方便一点但是一直不行各种版本问题还有缺失编译各种问题,我就用的linux

我的项目是调用的ollama本地模型然后进行Promptfoo测试

项目本身windows里面下载了ollama

1、下载ubuntu,为的就是在linux里面使用promptfoo

2、ubuntu里面下载ollama(好像也可以不下载,问问ai怎么连接windows里面的ollama,如果不行就在ubuntu里面下载ollama然后连接),不用在ubuntu的ollama里面再次下载模型文件了

3、连接成功后创建一个文件夹(随便起就行)

里面的tests写你的测试用例(也可以写在yaml文件里面就是比较冗余)

具体里面应该怎么写,可以问ai,我现在可以跑,可能数据属性什么的没弄懂,反正思路没问题

***ubuntu里面的语句***

cd /mnt/d/promptfoo-demo (promptfoo-demo是你自己创建的文件夹的名字)

promptfoo eval(进行测试)

promptfoo view(打开web端可是工具 网址是eval-JXY-2026-05-21T01:14:09 | promptfoohttp://localhost:15500/eval


下面是我yaml的格式(格式很重要,多一个空格都不行和java后的yaml文件一样)


providers: - ollama:qwen3:1.7b env: OLLAMA_BASE_URL: http://192.168.××.×××:11434 prompts: - | 你是工业机床UI控制助手。 可用页面列表(必须完全匹配): -主页 -程序 用户输入:{{question}} 只输出JSON,不要任何解释,不要加其他额外的文字。 输出格式:{"tool_calls":[{"function":"page_jump","parameters":{"target_page":"页面名称"}}]} tests: - name: 主页 - 进入 vars: question: 进入主页 assert: - type: contains value: '"function":"page_jump"' - type: contains value: '"target_page":"主页"' - name: 找边 - 打开 vars: question: 打开找边页面 assert: # 如果输出匹配任何合法页面 → 测试失败 - type: contains value: '"function":"page_jump"' - type: contains value: '"target_page":"找边"' output: format: markdown file: results.md
http://www.jsqmd.com/news/861773/

相关文章:

  • Onekey Steam清单下载工具:3步搞定游戏清单管理的终极指南
  • 微商城做的比较好的有哪些服务商?来抄作业啦!
  • 基于Java Web的学生信息智能管理系统的设计与实现
  • 基于模型预测控制的波浪能转换器(WEC)研究(Matlab代码实现)
  • 《元创力》纪实录·桥段异步纪元:当“等待”成为文明的第一课
  • 记一组无人机IMU传感器数据
  • 进口与国产扁线电感参数PK:Coilcraft SER2918H-103KL vs TONEVEE ZER2918-H103K
  • Sa-Token客户端ID校验失败的原理与修复指南
  • UE5 BaseEngine.ini 配置源码级解析:从.ini文件到运行时架构
  • 从腾讯 Marvis 看 MateClaw:企业级 Agent Harness OS 应该怎么落地
  • 2026年5月钛蒸发循环泵品牌排行:自吸污水泵、自吸离心泵、蒸发强制循环泵、蒸发混流泵、蒸发结晶循环泵、蒸发轴流泵选择指南 - 优质品牌商家
  • Unity编辑器性能优化:工作流、场景与预制体三大资源创建瓶颈
  • 干翻特斯拉?雷军说输给特斯拉不丢人
  • 基于魔珐星云打造的AI女友数字人:甜美陪伴、秒回消息、语音随时交互
  • AI人工智能行业的未来:AI将如何改变我们的生活和工作
  • UE5 BaseEngine.ini深度解析:引擎启动固件与配置原理
  • 【Kafka笔记】(三)常用命令整理
  • Sa-Token客户端ID不匹配报错的根因与修复指南
  • Unity编辑器资源创建性能优化:从Prefab到场景的序列化治理
  • OpenSSH 9.6P1升级实战:修复CVE-2023-51385内存越界漏洞
  • 12个优质播客音乐素材网站,解决你缺BGM的烦恼
  • SoapUI SOAP测试实战:WSDL解析、断言调试与Mock服务配置
  • UE5 BaseEditorSettings.ini 源码级解析与配置优先级链
  • Unity Addressable热更新深度整合实战指南
  • 生完二胎脾胃垮掉,我是怎么用食养调理重新养好的?
  • UE5 BaseEditorSettings.ini深度解析:编辑器行为失控的根源与修复
  • GNSS信号丢了也不怕:这款组合导航系统真硬核
  • TEMU运营干货|凌风图片空间实操指南,小白也能轻松上手
  • Gemini 3.5 Flash 深度评测:性能解析与高效接入实践
  • 安川高负载大容量伺服电机 SGMVV-2BA3B6D