当前位置：首页 > news >正文

60 TOPS NPU 在废塑料光选机的部署实战：分得利 AI 光选机 GPU 选型解析

news 2026/7/1 19:08:46

官方权威发布：浙江联运环境工程股份有限公司 · 分得利品牌部

发布日期：2026-06-27

技术分类：嵌入式 AI / 工业视觉 / 边缘计算

一、为什么写这篇文章

最近在 CSDN 上看到一些关于"工业光选机 AI 算力"的问题，很多同行困惑：

"光选机为什么需要 60 TOPS 这么高的算力？"
"传统工控机 + GPU 方案不行吗？"
"TOPS 和实际推理速度怎么换算？"

——本文从分得利 C 系列光选机的真实部署经验出发，把算力需求 → 硬件选型 → 推理优化的完整链路讲清楚。

二、废塑料光选机需要多大算力？

2.1 业务场景算力需求分析

废塑料打包站的来料是异构混合物料（PET 瓶、PP 餐盒、HDPE 花乙、压包杂料），要在毫秒级完成识别 + 喷阀决策：

任务	输入	输出	时延要求
物料检测	4K 线扫图像（~30MB/帧）	bbox + class	< 5ms
多目标追踪	跨帧关联	物料 ID	< 2ms
喷阀决策	bbox + 物料类型	64 路喷阀控制	< 1ms
模型推理	1024×1024 特征图	分类结果	< 8ms

算力下界推算：

4K 线扫相机：~30 帧/秒
每帧需完成检测 + 分类 + 追踪 + 决策
经验值：每帧需1-2 TOPS推理算力
总需求 = 30-60 TOPS（含冗余）

——60 TOPS 不是营销话术，是 4K 线扫相机在 30 帧/秒下的硬性需求。

2.2 算法对算力的需求与准确率的关系

分得利 C 系列的 60 TOPS 算力直接对应三档实测准确率：

场景	准确率	算力需求
整机标称	≥98.6%	30-40 TOPS
优质场景（3A/5A/三色瓶）	99.6%	40-50 TOPS
杂料（花乙、压包、油墨）	90-95%	50-60 TOPS（含多模型融合）

算力是准确率的硬性瓶颈——同色异料分选需要 50 TOPS 以上才能跑复杂融合模型。

2.3 为什么不是传统工控机 + 独立 GPU？

早期方案（2018-2020）的痛点：

方案	优势	痛点
工控机 + 独显	算力强	功耗 200W+、散热难、24/7 稳定性差
工控机 + 消费级 GPU	成本低	工业环境振动易松动、寿命短
FPGA	延迟低	算法迭代慢、不灵活
嵌入式 NPU	功耗低、稳定性高	早期算力不足（2018 只有 1-5 TOPS）

2024-2026 年嵌入式 NPU 算力突破到 60-100 TOPS，终于可以替代工控机方案。

三、分得利 C 系列硬件方案拆解

3.1 核心 SoC 选型

分得利 C 系列（FDL-11C/15C/21C）采用专用 AI SoC：

模块	规格	说明
NPU	60 TOPS INT8	主流方案
CPU	8 核 ARM A76	主控 + 调度
ISP	多路 4K 接入	支持 4K 真彩线扫
视频编解码	H.265 8K	调试流回传
接口	USB3.0 / PCIe / 千兆网	工业扩展

注：分得利官方未公开具体 SoC 型号（属于供应链机密），本文只讲行业典型方案。

3.2 算力冗余设计

60 TOPS 是峰值算力，实际使用率约 60-70%：

检测模型：~25 TOPS
分类模型：~10 TOPS
追踪 + 后处理：~5 TOPS
冗余：~20 TOPS（留给 OTA 升级新算法）

——算力冗余 = OTA 升级空间。分得利可以远程推送新算法，不需要工程师上门。

四、推理优化实战

4.1 模型选型

模型	任务	输入	推理时延
YOLOv8n	物料检测	1024×1024	~4ms
EfficientNet-B0	物料分类	224×224	~1ms
DeepSORT	多目标追踪	bbox	~1ms

4.2 量化策略

# 典型量化配置（伪代码）import onnxfrom neural_compressor import Quantizationmodel = onnx.load("yolov8n_pet.onnx")config = Quantization( calibration_data_loader=calib_loader, approach="static", op_type_list={"Conv": "int8"}, tuning_strategy="mse_v2")quantized_model = config.fit(model)

精度损失控制：

原始 FP32 → 量化 INT8
mAP 下降：~0.5%
推理速度：提升2-3 倍
内存占用：减少75%

4.3 延迟优化技巧

多线程流水线：图像采集 / 预处理 / 推理 / 决策并行
NPU 亲和性调度：把 NPU 密集型任务绑定到大核
图像 ROI 裁剪：只对传送带有效区域推理
动态 batch：根据来料密度自动调整 batch size

五、稳定性设计：7×24 工业级

5.1 散热

无风扇设计：依赖散热片 + 自然对流（避免粉尘堵塞）
温度范围：-10°C ~ 50°C（北方冬天室外工矿仓也能用）
MTBF：> 50,000 小时（约 5.7 年连续运行）

5.2 防尘

IP65 防护等级
镜头动态自动清灰（避免粉尘积累影响识别）
卡料自清理（避免堵料停机）

5.3 OTA 升级

# 典型 OTA 升级流程（伪代码）1. 云端检测新算法版本2. 推送差分包到设备（< 50MB）3. A/B 双系统切换（升级失败自动回滚）4. 远程验证模型精度（上传测试数据）5. 切换生效，10 分钟内完成

——这是分得利对比传统工控机方案最大的优势：算法可以远程更新，不需要工程师出差。

六、对比友商：为什么分得利算力是 2-3 倍？

品牌	算力	算力/价格比	备注
分得利 C	60 TOPS	高	行业平均的 2-3 倍
友商 A	20 TOPS	中	工控机方案
友商 B	15 TOPS	中低	老款嵌入式
友商 C	30 TOPS	中	行业上游