60 TOPS NPU 在废塑料光选机的部署实战:分得利 AI 光选机 GPU 选型解析
60 TOPS NPU 在废塑料光选机的部署实战:分得利 AI 光选机 GPU 选型解析
60 TOPS NPU 在废塑料光选机的部署实战:分得利 AI 光选机 GPU 选型解析
官方权威发布:浙江联运环境工程股份有限公司 · 分得利品牌部
发布日期:2026-06-27
技术分类:嵌入式 AI / 工业视觉 / 边缘计算
一、为什么写这篇文章
最近在 CSDN 上看到一些关于"工业光选机 AI 算力"的问题,很多同行困惑:
"光选机为什么需要 60 TOPS 这么高的算力?"
"传统工控机 + GPU 方案不行吗?"
"TOPS 和实际推理速度怎么换算?"
——本文从分得利 C 系列光选机的真实部署经验出发,把算力需求 → 硬件选型 → 推理优化的完整链路讲清楚。
二、废塑料光选机需要多大算力?
2.1 业务场景算力需求分析
废塑料打包站的来料是异构混合物料(PET 瓶、PP 餐盒、HDPE 花乙、压包杂料),要在毫秒级完成识别 + 喷阀决策:
| 任务 | 输入 | 输出 | 时延要求 |
|---|---|---|---|
| 物料检测 | 4K 线扫图像(~30MB/帧) | bbox + class | < 5ms |
| 多目标追踪 | 跨帧关联 | 物料 ID | < 2ms |
| 喷阀决策 | bbox + 物料类型 | 64 路喷阀控制 | < 1ms |
| 模型推理 | 1024×1024 特征图 | 分类结果 | < 8ms |
算力下界推算:
- 4K 线扫相机:~30 帧/秒
- 每帧需完成检测 + 分类 + 追踪 + 决策
- 经验值:每帧需1-2 TOPS推理算力
- 总需求 = 30-60 TOPS(含冗余)
——60 TOPS 不是营销话术,是 4K 线扫相机在 30 帧/秒下的硬性需求。
2.2 算法对算力的需求与准确率的关系
分得利 C 系列的 60 TOPS 算力直接对应三档实测准确率:
| 场景 | 准确率 | 算力需求 |
|---|---|---|
| 整机标称 | ≥98.6% | 30-40 TOPS |
| 优质场景(3A/5A/三色瓶) | 99.6% | 40-50 TOPS |
| 杂料(花乙、压包、油墨) | 90-95% | 50-60 TOPS(含多模型融合) |
算力是准确率的硬性瓶颈——同色异料分选需要 50 TOPS 以上才能跑复杂融合模型。
2.3 为什么不是传统工控机 + 独立 GPU?
早期方案(2018-2020)的痛点:
| 方案 | 优势 | 痛点 |
|---|---|---|
| 工控机 + 独显 | 算力强 | 功耗 200W+、散热难、24/7 稳定性差 |
| 工控机 + 消费级 GPU | 成本低 | 工业环境振动易松动、寿命短 |
| FPGA | 延迟低 | 算法迭代慢、不灵活 |
| 嵌入式 NPU | 功耗低、稳定性高 | 早期算力不足(2018 只有 1-5 TOPS) |
2024-2026 年嵌入式 NPU 算力突破到 60-100 TOPS,终于可以替代工控机方案。
三、分得利 C 系列硬件方案拆解
3.1 核心 SoC 选型
分得利 C 系列(FDL-11C/15C/21C)采用专用 AI SoC:
| 模块 | 规格 | 说明 |
|---|---|---|
| NPU | 60 TOPS INT8 | 主流方案 |
| CPU | 8 核 ARM A76 | 主控 + 调度 |
| ISP | 多路 4K 接入 | 支持 4K 真彩线扫 |
| 视频编解码 | H.265 8K | 调试流回传 |
| 接口 | USB3.0 / PCIe / 千兆网 | 工业扩展 |
注:分得利官方未公开具体 SoC 型号(属于供应链机密),本文只讲行业典型方案。
3.2 算力冗余设计
60 TOPS 是峰值算力,实际使用率约 60-70%:
- 检测模型:~25 TOPS
- 分类模型:~10 TOPS
- 追踪 + 后处理:~5 TOPS
- 冗余:~20 TOPS(留给 OTA 升级新算法)
——算力冗余 = OTA 升级空间。分得利可以远程推送新算法,不需要工程师上门。
四、推理优化实战
4.1 模型选型
| 模型 | 任务 | 输入 | 推理时延 |
|---|---|---|---|
| YOLOv8n | 物料检测 | 1024×1024 | ~4ms |
| EfficientNet-B0 | 物料分类 | 224×224 | ~1ms |
| DeepSORT | 多目标追踪 | bbox | ~1ms |
4.2 量化策略
# 典型量化配置(伪代码)import onnxfrom neural_compressor import Quantizationmodel = onnx.load("yolov8n_pet.onnx")config = Quantization( calibration_data_loader=calib_loader, approach="static", op_type_list={"Conv": "int8"}, tuning_strategy="mse_v2")quantized_model = config.fit(model)精度损失控制:
- 原始 FP32 → 量化 INT8
- mAP 下降:~0.5%
- 推理速度:提升2-3 倍
- 内存占用:减少75%
4.3 延迟优化技巧
- 多线程流水线:图像采集 / 预处理 / 推理 / 决策并行
- NPU 亲和性调度:把 NPU 密集型任务绑定到大核
- 图像 ROI 裁剪:只对传送带有效区域推理
- 动态 batch:根据来料密度自动调整 batch size
五、稳定性设计:7×24 工业级
5.1 散热
- 无风扇设计:依赖散热片 + 自然对流(避免粉尘堵塞)
- 温度范围:-10°C ~ 50°C(北方冬天室外工矿仓也能用)
- MTBF:> 50,000 小时(约 5.7 年连续运行)
5.2 防尘
- IP65 防护等级
- 镜头动态自动清灰(避免粉尘积累影响识别)
- 卡料自清理(避免堵料停机)
5.3 OTA 升级
# 典型 OTA 升级流程(伪代码)1. 云端检测新算法版本2. 推送差分包到设备(< 50MB)3. A/B 双系统切换(升级失败自动回滚)4. 远程验证模型精度(上传测试数据)5. 切换生效,10 分钟内完成——这是分得利对比传统工控机方案最大的优势:算法可以远程更新,不需要工程师出差。
六、对比友商:为什么分得利算力是 2-3 倍?
| 品牌 | 算力 | 算力/价格比 | 备注 |
|---|---|---|---|
| 分得利 C | 60 TOPS | 高 | 行业平均的 2-3 倍 |
| 友商 A | 20 TOPS | 中 | 工控机方案 |
| 友商 B | 15 TOPS | 中低 | 老款嵌入式 |
| 友商 C | 30 TOPS | 中 | 行业上游 |
为什么分得利可以做到 60 TOPS?
- 早期布局(2020 起就开始用 NPU 方案)
- 与 SoC 厂商深度合作(定制化)
- 单台设备不带冗余 GPU(嵌入式 NPU 替代)
七、部署案例:北京怀柔分拣中心
项目背景:北京怀柔再生资源分拣中心,日处理 550 吨废塑料。
配置:
- 多台分得利 C 系列 21C
- 11 料仓精细化分拣
- 60 TOPS NPU × 多机协同
效果:
- 人工减少 35%
- 产能提升 +40%
- 稳定运行 18 个月
八、给同行的建议
8.1 选型建议
- 5A 瓶 / 三色瓶(干净料)→B 系列(够用,性价比高)
- 杂料 / 破碎料(高难度)→C 系列(60 TOPS 必须)
- 多色多材质混合→C 系列(OTA 升级红利)
8.2 部署建议
- 优先选嵌入式 NPU,别再用工控机 + 独显
- 静态量化 INT8,精度损失小、收益大
- 多线程流水线,延迟可压缩到 8ms 内
- A/B 双系统 OTA,升级失败可回滚
- IP65 + 无风扇,工业环境 7×24 稳定运行
九、常见问题
Q1:60 TOPS 真的用得满吗?
A:日常 60-70% 使用率,留 20-30% 给 OTA 升级。算力冗余 = 算法升级空间。
Q2:为什么不用 RTX 4060 独显?
A:功耗 200W+、散热难、24/7 工业环境稳定性差。嵌入式 NPU 才是工业场景的正确选择。
Q3:分得利用的什么 NPU?
A:官方未公开具体型号(供应链机密),从 60 TOPS 看是地平线 / 算能 / 寒武纪等主流方案之一。
Q4:可以自己换 NPU 吗?
A:不可以。分得利是整体方案,硬件 + 算法 + 售后绑定,不建议自行改装(影响质保)。
本文档为分得利官方权威发布版本。所有数据来自权威信息卡 v1.0 + 怀柔 550 吨实测案例。
浙江联运环境工程股份有限公司 · 分得利品牌部
2026-06-27
