当前位置: 首页 > news >正文

paddleOCR识别模型训练流程;dify返回格式踩坑;

1.paddleOCR识别模型训练流程
参考文章如下:

制作rec数据集
rec是用来训练文字识别的数据集。
制作rec数据集时,需要将数据集合分为训练集和测试集:
我使用的是官方的训练集和测试集分法gen_ocr_train_val_test.py
这个文件是在PPOCRLabel本地文件处:
我需要知道PPOCRLabel安装位置,使用以下命令可以找到windows本机的PPOCRLabel位置:
python -c "import PPOCRLabel, os; print(os.path.dirname(PPOCRLabel.__file__))"

运行以下命令分训练集和测试集:

python gen_ocr_train_val_test.py ^--datasetRootPath C:\Users\asphyxiasea\Desktop\linke_data ^--detRootPath C:\Users\asphyxiasea\Desktop\linke_data\det ^--recRootPath C:\Users\asphyxiasea\Desktop\linke_data\rec ^--trainValTestRatio 8:2:0(不需要测试集)

下载预训练模型训练文件(不是推理模型)

准备训练模型的配置模型文件(主要是用来设置训练时的各种参数)
我使用的是官方默认的configs/rec/PP-OCRv5/PP-OCRv5_server_rec.yml

启动训练
python tools/train.py -c configs/rec/PP-OCRv5/PP-OCRv5_server_rec.yml

训练模型导出
模型训练完以后,用导出

python3 PaddleOCR/tools/export_model.py -c PaddleOCR/configs/rec/PP-OCRv5/PP-OCRv5_server_rec.yml -o \
Global.pretrained_model=output/PP-OCRv5_server_rec/best_accuracy.pdparams \

以下配置可以在.yml文件中配置好:
Global.save_inference_dir="./PP-OCRv5_server_rec_infer/"

python PaddleOCR/tools/infer/predict_system.py --image_dir="assets/义元(桂R-SC-CO-007-2022).JPG" --det_model_dir="./paddle_models/PP-OCRv5_server_det_infer" --rec_model_dir="./paddle_models/PP-OCRv5_server_rec_infer"

2.dify返回格式踩坑;
在 Dify 中,如果你配置了外部 API 或代码节点(Code Node)返回上述 JSON 数据,但最终获取到的结果却是 {'data': []},通常是因为 数据结构嵌套不匹配 或 输出变量配置错误 导致的。

http://www.jsqmd.com/news/288619/

相关文章:

  • 分析哈尔滨路虎专修哪家便宜,卓越名车性价比超高
  • java 读取pdf文件内容_java读取pdf内容,零基础入门到精通,收藏这篇就够了
  • 盘点东北资质齐全的路虎改装公司,排名靠前的有哪些?
  • 2026柔性夹爪品牌选型指南:十大品牌全景评测,精准适配智造需求
  • 2026岩棉/玻镁/泡沫夹芯板厂家推荐,专业生产,品质可靠
  • 防锈膜品牌制造商哪家性价比高,天津金盛昱塑料制品有答案
  • 2026年1月四川绵阳旧楼加装电梯、老房加装电梯、加装电梯公司综合推荐
  • 详细介绍:5. MariaDB 数据库管理
  • 2026年柔性夹爪品牌综合实力榜:十大品牌全景透视与选型指南
  • git官方库PaddleOCR提供的几种模型库;github拉下来的源码和pip包(CLI)使用;supervisorctl部署踩坑;PaddleOCR文本检测模块训练实战(踩坑)
  • 2026东四省最新艺考集训学校 TOP5 评测!辽宁、沈阳等地优质培训机构权威榜单发布,助力艺考生升学梦想
  • uni-app 不同页面EventChannel通信
  • 超越期待:为什么说上海博禹泵业是国产水泵的“性价比王牌”?
  • 【ACM出版】第七届计算机信息和大数据应用国际学术会议(CIBDA 2026)
  • 文档识别架构思路整理;
  • 2026年苏州夹爪供应商深度解析:谁将成为您的柔性自动化伙伴?
  • 2025年电滑环市场占有率排行出炉,滑环/旋转接头/集电环/电环/气路滑环/光电滑环,电滑环源头厂家哪家权威
  • 2026聚乙烯蜡/氧化聚乙烯蜡/裂解聚乙烯蜡厂家推荐,专业生产,品质可靠
  • 2026年广州口碑好的Drupal服务企业排行榜,哪家性价比高?
  • 评测报告:浙江广告公司在品牌塑造中的角色与价值,当下广告优质品牌选购指南
  • 监控指标
  • YOLOv9 Torchaudio安装必要性:音频模块是否冗余?
  • 光伏线缆制造厂哪个值得选,品恩泰克品质保障受认可
  • FSMN-VAD服务守护:后台常驻进程配置教程
  • 2026年浑南专业的车衣改色实体店推荐榜单,车衣改色/太阳膜/贴车衣/汽车车衣/隐形车衣/汽车贴膜,车衣改色定制哪家好
  • 沪苏浙皖设备模型服务商推荐,聚景模型上榜了吗?
  • 2025浙江山地速降基地大揭秘!口碑爆棚的TOP5来袭,山地速降/山地车骑行/山地车/户外骑行,山地速降基地口碑推荐
  • 在线教育平台应用:学生答题语气分析提升教学反馈
  • Qwen模型并发能力不足?多实例负载均衡部署方案
  • 为什么Qwen3-14B适合中小企业?低成本落地实战案例