当前位置: 首页 > news >正文

CANN PID整定全链路端到端验证

PID FOPDT full-chain E2E harness

【免费下载链接】mat-chem-sim-pred面向工业领域,聚焦计算仿真、预测两大核心场景,构建面向流程工业"机理+数据"双轮驱动的领域计算层,推动AI for Science在材料化学领域的深度应用。项目地址: https://gitcode.com/cann/mat-chem-sim-pred

End-to-end validation of the FOPDT PID-tuning pipeline, chaining the real operatorsfit → tuning_rule → fopdt_rollout → performance_metricsand comparing against a CPU reference.

Two tools are provided:

ToolPurposeCompares against
e2e_orchestrator.pyAccuracy: drives the 4 operators stage-by-stage (e2e_runner) and checks each stage against its Python reference.per-stage CPU reference (common/*_reference.py)
e2e_perfPerformance: single-process, device-resident chaintuning_rule → fopdt_rollout → performance_metrics, timed vs a CPU 64-thread chain; also re-checks final best-PID / score / metrics alignment.CPU multi-thread chain (in-process)

The rollout stage dominates the chain cost (tuning/metrics are ~0.05 ms each), so the chain speedup tracks the rollout speedup.

Build

The operators must be built first (each<op>/build/lib<op>_host.soand<op>/build/lib/lib<op>_kernel_lib.sopresent). Then, from this directory:

bash build_e2e.sh # produces ./e2e_perf and ./e2e_runner

Override the toolkit location withASCEND_HOME/ASCEND_TOOLKIT_ENVif it is not at the default/usr/local/Ascend/ascend-toolkit/latest.

Run — performance (e2e_perf)

# args: <device> [batch=128] [candidates=1024] [sim_steps=1024] \ # [candidate_tile=0:auto] [iters=5] [warmup=2] [threads=64] ./e2e_perf 0 128 16384 1024 0 5 2 64

candidate_tile=0lets the rollout operator auto-select the optimal tile (min(candidates, kLane=768)); pass an explicit value only to sweep the knob. Example representative-scale result (Ascend910B3, B=128, sim_steps=1024, auto tile): C=1024 ≈ 4.0x, C=4096 ≈ 6.2x, C=16384 ≈ 4.5x vs CPU 64T.

Run — accuracy (e2e_orchestrator.py)

export E2E_RUNNER=$PWD/e2e_runner # required: path to the built runner export E2E_WORK=/tmp/e2e_work # optional: scratch dir for .bin I/O # export PID_COMMON=/path/to/PIDModelFit/common # optional override; defaults to ../common python3 e2e_orchestrator.py

It writes a per-stage comparison report to$E2E_WORK/e2e_report.jsonand prints the max error of each stage (NPU vs reference). All four stages align to within float32 tolerance.

【免费下载链接】mat-chem-sim-pred面向工业领域,聚焦计算仿真、预测两大核心场景,构建面向流程工业"机理+数据"双轮驱动的领域计算层,推动AI for Science在材料化学领域的深度应用。项目地址: https://gitcode.com/cann/mat-chem-sim-pred

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/1124196/

相关文章:

  • STM32与25CSM04 EEPROM的高速数据检索优化实践
  • 10个实用p5示例教程:让你的Python代码动起来
  • Juggl高级过滤技巧:如何精确控制图视图中显示的节点和边
  • 5个核心技巧:使用BeeRef高效管理视觉参考素材的完整指南
  • nwpu-cram之信息检索:算法与实现 - 西北工业大学软件学院复习资料宝库解析 [特殊字符]
  • Varnish Dashboard核心功能深度解析:从监控到管理的10大特性
  • NVMeFix常见问题解决:VMware和Samsung PM981死机修复终极指南
  • Context vs 其他MCP客户端:为什么选择这款macOS原生应用
  • FPDF图像处理完全教程:插入和操作图片的10个技巧
  • ContEx与Phoenix LiveView集成:实时数据可视化最佳实践指南
  • 火山引擎Coding Plan抢购难?开发者API调用成本控制与多模型切换实战指南
  • CANN/cann-recipes-infer Qwen3-next优化样例
  • svu高级用法:如何自定义版本前缀、标签模式和预发布版本
  • 终极指南:如何用OpCore Simplify在15分钟内完成黑苹果EFI配置
  • Attributed框架社区贡献指南:如何参与开源开发
  • 思源宋体CN:免费开源中文字体的终极完整指南
  • readpe完整工具链解析:peldd/pehash/pesec等11款配套工具使用详解
  • 为什么electron-prebuilt被合并?Electron团队的战略考量
  • 归藏提示词库PPT设计宝典:渐变拟物玻璃卡片风格完整教程
  • Elm-platform构建工具:elm-make编译Elm项目的完整教程
  • MCD-Gesture 2022 TI AWR1843 微多普勒手势识别 数据集
  • 2026年最新智慧园区公司怎么选?3个方法帮你挑到靠谱合作方
  • 如何用Flipper Zero破解本田汽车钥匙信号:CVE-2022-27254完整指南
  • WCF服务容器化教程:基于dotnet-framework-docker的微服务架构实现
  • Instatic可视化差异与合并工具:内容版本比较的终极指南
  • Error Lens对比其他错误高亮插件:为什么它是最佳选择
  • 【信息科学与工程学】【制造工程】第三十八篇 制造工艺中的制造数学01
  • BlueHound性能优化:处理大规模企业网络数据的高效技巧
  • 从0到1:使用Laravel Vonage Notification Channel构建用户注册短信验证系统
  • Gemini模型技术演进与国产大模型替代方案指南