kernel组培训概要

入职培训概要

1、熟悉kernel编译流程。

以矩阵乘法kernel为例子。

2、熟悉opencl/pyopencl异构编程接口。

简单Kernel代码:

熟悉芯片编程架构/cache结构/systolic array
相关资料:

    confluence/Technology Documents/CSR_CORE hardware description

confluence/Technology Documents/Systolic array hardware description and API use guide.

熟悉testing和tuning流程。
示例代码(简单):pint_sdk/test/kernels/dnn/tensor_ops/tune_average_pool_2D_f32.py
示例代码:pint_sdk/test/kernels/blas/level3/tune_gemm_f32.py
tuner python库:pint_sdk/test/kernel_tuner/

  1. Miniconda环境安装

安装文件位置:/home/swshare/yzeng/Miniconda3***.sh。

conda安装完成之后,启动conda,继续使用pip安装pyopencl/scipy/pandas

上一篇:Linux系统下,绑定USB串口设备号,解决上电USBID随机情况


下一篇:分布式项目中如何用redis做缓存(二)——redis的String和hash数据类型