当前位置: 首页 > news >正文

读取本地图像数据传递给多模态大模型进行处理并返回结果

读取本地图像数据传递给多模态大模型进行处理并返回结果

读取本地图像数据传递给多模态大模型进行处理并返回结果

importbase64fromopenaiimportOpenAIfromPILimportImageimportioimportos# =========================# 配置# =========================API_BASE="http://192.168.8.221:9024/v1"MODEL_NAME="Qwen2-5-VL-72B-Instruct-quantized-w8a8"IMAGE_PATH="/home/data/project/customer_AAA/ultralytics-yolov5-student/6all/000339.jpg"# ← 替换为你的本地图像路径# =========================# 初始化 OpenAI Client# =========================client=OpenAI(base_url=API_BASE,api_key="EMPTY"# vLLM 不校验 key,填任意值即可)# =========================# 读取并编码图片(Base64)# =========================defload_image_base64(image_path:str)->str:withopen(image_path,"rb")asf:image_bytes=f.read()returnbase64.b64encode(image_bytes).decode("utf-8")image_base64=load_image_base64(IMAGE_PATH)# =========================# 构造 Prompt(严格控制格式)# =========================prompt_text=""" 请根据给定图片进行分析,并严格按照以下格式输出: --- ## 一、场景特点 (分点说明) ## 二、预期检测难点 (分点说明) --- 只输出上述结构,不要输出多余内容。 """# =========================# 调用多模态模型# =========================response=client.chat.completions.create(model=MODEL_NAME,messages=[{"role":"user","content":[{"type":"text","text":prompt_text},{"type":"image_url","image_url":{"url":f"data:image/jpeg;base64,{image_base64}"}}]}],temperature=0.2,max_tokens=800)# =========================# 输出结果# =========================print("="*60)print("模型输出结果:")print(response.choices[0].message.content)
http://www.jsqmd.com/news/144571/

相关文章:

  • 重庆工商大学毕业设计说明书模板及格斯要求(工科类专业适用)(8)
  • 基于CSS与JavaScript的水果忍者网页动画实现
  • Open-AutoGLM总体框架全揭秘(20年架构师亲授)
  • 耳机插电脑没声音是驱动问题吗?深度解析原因与两种修复方案
  • 冥想第一千七百四十五天(1745)
  • 基于 PLC 的卷扬机控制系统设计
  • PHP代码调试全链路深度研究与最佳实践指南
  • ANSYS APDL角型板疲劳分析实例与命令流
  • 为什么90%的团队在部署Open-AutoGLM时踩坑?真相在这里
  • Python爬虫urllib3与requests模块详解
  • CSS Flexbox 布局完全指南
  • 2025管理咨询推荐机构TOP5权威榜单:甄选企业管理咨询公司 - 工业品网
  • CSS动画实现水果忍者游戏界面
  • A2UI:智能问数的界面构建策略解析
  • Open-AutoGLM架构全景图曝光,掌握未来AI工程化关键路径
  • 基于 PLC 的工业搬运机器人设计
  • 2.5D Generator 2.0:PS一键生成2.5D插画插件
  • Win7程序崩溃问题解决全攻略
  • Open-AutoGLM虚拟化支持深度解析:这4个坑90%的人第一次都会踩
  • 上海建工3D打印人行桥在泉州落成
  • GPU直通还是容器化?Open-AutoGLM挂虚拟机的3种方案对比
  • 关于智能体(AI Agent)搭建,Dify、n8n、Coze、织信的超详细总结!
  • 网件EAX80 WiFi 6扩展器开箱与实测
  • AI 应用:数据整合与认知革命
  • Java毕设选题推荐:基于springboot的汽车租赁管理系统springboot汽车租赁智慧管理【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 为什么需要Embedding?Embedding的本质是什么?
  • 8个降AI率工具推荐!继续教育人群必备神器
  • Java毕设项目推荐-基于springboot的高校学生公寓系统学生入住信息、房间分配情况、设备维修记录【附源码+文档,调试定制服务】
  • 2025年水旋打磨房排行榜,新测评精选靠谱的水旋打磨房供应商推荐 - 工业设备
  • Grafana 如何提供7*24小时的监控