当前位置: 首页 > news >正文

OpenCL Programming Model


一、概述
OPenCL是用于异构平台编程矿机,包括CPU,GPU,FPGA,DSP,AI加速器等。

OpenCl Host:CPU
OpenCl Devices:GPU,FPGA,DSP,AI accelerator


二、系统层次
1层------application-------------
2层------opencl-------------------
3层------XRT----------------------
4层------os driver----------------
5层------fpga/gpu/dsp driver-------

三、OPENCL Model
1.Platform model

2.memory model

3.Execution Model


三、XRT Xilinx Runtime
Xilinx Runtime (XRT)框架

四、kernelADD

arg这个参数定义为axilite接口;

int*v定义为axi-mm接口,并且使用axilite来指定axi-mm的基地址!!!!

五、KernelB

上述代码中都指定axi-mm接口,并使用axilite来指定base_address基地址!

六、DMA model

dma + pcie,其中pice的吞吐量是至关重要的!


DMA operation : io cmd
cpu program DMA是比较花费时间的,一般30ms~60ms
pcie transfer的时间太小就划不来,所以pcie设置的buffer size不能太小

所以buffer要大一些

也就是要开辟的buffer size大小,让pcie的transfer time大于cpu program dma的time,这样就比较合适。

七、带宽计算

DDR3200
1chanenl 64bit/1channel 32G*8=25GB
4channel = 100GB

PCIE:8Gb*16lane = 16GB

Compute:
DSP有5952个slice,约6k个slice
dsp计算A*B+C为12Byte
6k*300MZ*12B=25TB
所以pcie和DDR3200都满足不了DSP

但是,可以看到SRAM为24TBS,这个就是block ram

启发:
最好你DSP计算需要用的data就从on-chip buffer上拿,然后
reuse这个buffer就能得到好的效率。
所以设计的时候从host ddr中预取数据到on-chip buffer上,然后
让compute计算单元,而已就是DSP模块从one-chip buffer拿数据,
就能达到好的效果。

http://www.jsqmd.com/news/136042/

相关文章:

  • GPT-SoVITS支持SpaceX星链吗?低延迟全球部署
  • 12.25
  • GPT-SoVITS语音合成金融级安全标准:等保三级要求
  • GPT-SoVITS语音合成伦理审查清单:开发者自查表
  • GPT-SoVITS模型开源许可证变更预警:MIT是否延续?
  • GPT-SoVITS多音字处理能力测试:中文发音准确性评估
  • JLink接口定义详解:STM32调试引脚功能全面讲解
  • 我和佛家是什么关系?
  • GPT-SoVITS与暗物质研究结合:未知领域的语音模拟
  • 构建自动化烧录流水线:usb_burning_tool项目应用
  • LVGL与STM32结合的核心要点解析
  • STM32CubeIDE报错 no stlink detected 的通俗解释与应对方法
  • STM32通过软件控制RS485收发状态切换:小白指南
  • GPT-SoVITS模型众包训练设想:全民参与模型进化
  • UVa 10262 Suffidromes
  • NAS生成模型边缘部署延迟高 后来才知道分层剪枝关键路径
  • 告别昂贵语音定制:GPT-SoVITS让你快速克隆声音
  • esp32引脚驱动能力解析:适合初学者的理解方式
  • Proteus元件对照表详解:硬件仿真建模必备参考
  • GPT-SoVITS语音克隆星际移民准备:外星殖民地语音系统
  • 如何用GPT-SoVITS训练自己的虚拟主播语音?
  • GPT-SoVITS模型宇宙通识:全维度生命沟通协议
  • 从官网获取Multisim下载资源:安全可靠的安装路径
  • Proteus8.9安装路径设置:项目应用中的关键细节
  • STM32CubeMX使用教程:图解说明引脚分配与复用功能
  • [第三章 web进阶]SSTI 1 WP
  • Multisim 14.0元件库下载实践教程:结合仿真验证
  • STM32波形发生器中断服务程序优化:深度剖析
  • GPT-SoVITS支持WebAssembly吗?浏览器内核运行
  • 工业控制中STM32CubeMX安装包的完整指南