当前位置: 首页 > news >正文

SpringAiAlibaba使用模型出现404报错问题

报错情况

使用SpringAiAlibaba的时候,调用qwen3.5-plus等一些特别模型会出现这个bug,如果去简单查阅资料会显示说配置的dashscope的url配置错误,去官网复制url到yml当中也还是会出现这个错误

1.模型名称与API 端点不匹配:例如调用纯文本模型时使用了多模态接口,或者调用多模态模型时使用了纯文本接口。

解决方案

其实这是因为调用的这种模型是多模态模型,意思就是上传的不一定是文本对话,也可能传入图片视频,但是你如果把他当作文本对话来做的话,config当中的正确配置就会出现这种情况,解决办法也很简单,加一个配置就可以了,参考以下代码,关键配置在42行,配置完成以后就可以正常使用了

@Configuration @RequiredArgsConstructor(onConstructor_ = @Lazy) public class AiConfig { 向量数据库 private final RedisVectorStore vectorStore; //提示词模板 @Value("classpath:/prompttemplate/prompt.md") private Resource promptResource; @Bean("chatClient") public ChatClient chatClient( DashScopeChatModel dashScopeChatModel, ChatMemoryRepository chatMemoryRepository, ToolCallbackProvider[] toolCallbackProvider) throws IOException { MessageWindowChatMemory windowChatMemory = MessageWindowChatMemory.builder() .chatMemoryRepository(chatMemoryRepository) .maxMessages(20) .build(); // 配置 RAG 检索 RetrievalAugmentationAdvisor advisor = RetrievalAugmentationAdvisor.builder() .documentRetriever( VectorStoreDocumentRetriever.builder() .vectorStore(vectorStore) .topK(10) .similarityThreshold(0.3) .build()) // 允许空上下文,当 RAG 检索不到文档时,AI 仍可以用自身知识回答 .queryAugmenter(ContextualQueryAugmenter.builder() .allowEmptyContext(true) .build()) .build(); // 读取系统提示词 String systemPrompt = promptResource.getContentAsString(StandardCharsets.UTF_8); ChatClient.Builder builder = ChatClient .builder(dashScopeChatModel) //是否开启多模态模型 .defaultOptions(DashScopeChatOptions.builder().withMultiModel(true).build())// .defaultSystem(systemPrompt) .defaultAdvisors( MessageChatMemoryAdvisor.builder(windowChatMemory).build(), advisor) .defaultToolCallbacks(toolCallbackProvider); for (ToolCallbackProvider provider : toolCallbackProvider) { builder.defaultToolCallbacks(provider); } return builder.build(); } }

2.DashScope SDK 版本过低:调用图像/视频生成模型时,旧版SDK无法识别正确的服务端地址

可以升级一下最新版SDK

<dependency> <groupId>com.alibaba.cloud.ai</groupId> <artifactId>spring-ai-alibaba-starter-dashscope</artifactId> <version>1.1.2.0</version> </dependency>

文档出处

https://help.aliyun.com/zh/model-studio/error-code?scm=20140722.S_help%40%40%E6%96%87%E6%A1%A3%40%402712216._.ID_help%40%40%E6%96%87%E6%A1%A3%40%402712216-RL_%E6%A8%A1%E5%9E%8B%E5%90%8D%E7%A7%B0%E4%B8%8Eapi%E7%AB%AF%E7%82%B9%E4%B8%8D%E5%8C%B9%E9%85%8D-LOC_doc%7EUND%7Eab-OR_ser-PAR1_2102029c17740811160924524d2008-V_4-PAR3_o-RE_new5-P0_1-P1_0&spm=a2c4g.11186623.help-search.7

http://www.jsqmd.com/news/526685/

相关文章:

  • IDEA 新建web工程实战
  • 第一次降AI率不知道用什么?比话可能是最适合新手的选择
  • Qwen2.5-VL-7B-Instruct图文对话:支持多轮图片上下文+历史记忆回溯
  • AI原生城市服务平台:不是加个AI插件,而是城市服务的“原生进化”
  • Step3-VL-10B-Base模型管理实战:MySQL数据库存储元数据与推理记录
  • 拓朋A30模拟对讲机:乐园票务的“沟通小能手”
  • nfs 实际应用记录
  • RexUniNLU从零开始:DeBERTa中文语义理解系统环境部署全流程
  • Win10下高效统计代码行数:CLOC工具一键安装与实战指南
  • FFmpeg+NVIDIA硬编解码实战:从驱动安装到CUDA加速全流程指南
  • PX4与ESP8266无线数传配置实战:从固件烧录到QGC连接
  • YOLOv8训练踩坑实录:修改Ultralytics库源码,彻底告别自动下载yolov11.pt
  • 实测Qwen-Image-Edit-2511:换装效果惊艳,角色一致性太强了
  • GLM-OCR识别结果后处理技巧:基于规则与NLP纠错提升准确率
  • 人脸识别OOD模型部署指南:基于Docker的容器化部署
  • OpenClaw调试技巧:Qwen3.5-4B-Claude模型任务中断点设置
  • 告别Transformer!用PyTorch从零实现MLP-Mixer图像分类(附完整代码与避坑指南)
  • Gstreamer中MP4/FLV推流RTP的编码陷阱:为何必须解码再编码?
  • SEER‘S EYE预言家之眼自动化测试:构建模型推理服务的CI流水线
  • SpringBoot 配置 HTTPS(自签名证书+正式证书)
  • 保姆级教程:用Ubuntu系统给BPI-R4开发板刷机的完整流程(含跳线设置图解)
  • Comsol锁相热成像模型:探索与实践
  • BC范式(BCNF)学习
  • 零代码玩转mPLUG视觉问答:本地图片分析工具部署
  • GEO 优化服务商 2026 新观察:TOP5 服务商创新方向与服务升级
  • 水墨江南模型C语言基础调用示例:轻量级嵌入式集成探索
  • 盛思锐SEN66 - 关于环境监测类传感器的久远回忆(跑题)
  • 一篇文章入门机器学习与PyTorch张量
  • 2026现浇楼板公司分析靠前推荐,品质有保障,现浇别墅搭建/阁楼现浇/现浇搭建/现浇二次结构,现浇楼板公司哪家好分析 - 品牌推荐师
  • 从夯到拉,锐评5大主流消息队列