当前位置: 首页 > news >正文

为什么即使做了 array_partition 还是出现“limited memory ports”警告和 II 违规?

一、设计
line_buf[2][INWIDTH],应用了
#pragma HLS ARRAY_PARTITION variable=line_buf cyclic factor=9 dim=2
#pragma HLS ARRAY_PARTITION variable=line_buf dim=1 complete

二、现象
做了 array_partition 还是出现“limited memory ports”警告和 II 违规。

三、分析
1.RESIZE_NPPC_LOOP2 中读取 line_buf 时仍然因为内存端口不足而无法调度;
2.RESIZE_NPPC_LOOP 和 RESIZE_NPPC_LOOP1 有 carried dependence 导致 II = 8;
3.“Unable to schedule 'load' operation ... on array 'line_buf[0][7].V' ... due to limited memory ports.” 这意味着对同一个数组元素 line_buf[0][7] 有多个读请求同时发生,而该元素所在的 memory bank 端口数不足以同时服务这些读取。
就是同一个地址需要多次获取,发生了拥挤,从而造成II的值特别大。
对于不同的 k,x0 和 x1 可能相同吗?有可能。例如当缩放导致多个相邻输出像素映射到同一个输入坐标?但注意 dst_x 每次递增 NPPC,内层 for k 展开,current_dst_x 连续,x0 和 x1 可能会相邻,但不太可能所有 k 都映射到同一点。然而,警告特别指出 line_buf[0][7].V 读取操作 line_buf_0_7_V_loa_4。
4.如果 scale_x > 1(缩小),那么 x0 可能跳跃;如果 scale_x < 1(放大),x0 可能重复。所以可能多个 k 的 x0 相同或 x1 相同。即使不同,由于 cyclic factor=9,相邻的 x0 可能落在不同 bank
5.line_buf[0][7] 被多次 load,说明 bank 7 上的 7 号元素被多次读取(也许是不同 k 的 x0 都等于 7,或者 7 与 6、8 在不同 k 中同时需要 bank 7 的元素)。此外,还要注意 line_buf 也可能在 RESIZE_NPPC_LOOP2 之前被写入,但此循环只读,无写冲突,只考虑读端口。

http://www.jsqmd.com/news/804921/

相关文章:

  • 深度学习——迁移学习实战指南
  • 图片去水印怎么操作?免费图片去水印工具2026实测,这几种方法真的好用 - 科技热点发布
  • 厚街家电清洗哪家值得推荐:秒杀家电清洗信誉好 - 17329971652
  • 免费图片去水印工具推荐:2026实测哪款效果好?图片水印怎么去除 - 科技热点发布
  • 寄存器链设计思路
  • 53.tcp socket
  • 值得信赖!广州晶石石英式动态称重传感器,以工匠精神铸就品质 - 品牌速递
  • 5/12
  • 【企业级AI效能审计】:Perplexity Pro在代码审查/论文研读/竞品分析中的实际吞吐量下降曲线与临界性价比拐点
  • 告别电网波动干扰:手把手教你用双同步坐标系锁相环搞定不平衡电压
  • 告别试错式编程:用结构化迭代与AI协同优化代码
  • 厚街联合办公哪家值得推荐:秒杀联合办公卓越典范 - 17322238651
  • 厚街管道疏通哪家值得推荐:秒杀管道疏通超高效 - 13724980961
  • 从平局投票看技术社区运营:低门槛互动如何提升用户参与感
  • 【AI】动态规划:执行中调整计划的实现
  • 嘉兴中小微企业财税攻略:会计事务所选择全解析 - 速递信息
  • 纳米芯片可靠性设计:从电迁移、NBTI到系统级验证实战
  • HDLbits刷题避坑:FSM与计数器组合题Q3a的三种常见错误写法(附Verilog代码对比)
  • 独立开发者一人公司如何高效管理多个API Key与用量
  • 开源工业物联网框架openOii:从协议解析到规则引擎的实战指南
  • UVa 203 Running Lights Visibility Calculator
  • 图片去水印用什么工具?免费图片去水印工具推荐,2026 实测哪款好用 - 科技热点发布
  • Ollama模型下载加速:绕过官方源,从Hugging Face等镜像站快速部署本地大模型
  • 我用 AI 写了一首歌,并把它上传到了 QQ 音乐、酷狗音乐、酷我音乐
  • WebChatGPT:为ChatGPT添加实时联网搜索功能的浏览器扩展详解
  • 从NOIP真题到日常开发:用Python和C++两种思路搞定‘数字统计’问题
  • 厚街婚礼策划哪家值得推荐:秒杀婚礼策划匠心定制 - 17329971652
  • 对比按需调用与 Token Plan 套餐在长期项目中的成本差异感受
  • Linux通过cgroups限制进程的cpu、内存使用率
  • 鼻毛剪刀哪个牌子好?鼻毛修剪器哪个牌子好?鼻毛剪十大品牌推荐