-
CUDA模板下的C/C++线性代数子例程开发
资源介绍
CUTLASS 2.1 CUTLASS 2.1-2020年4月CUTLASS是CUDA C ++模板抽象的集合,用于在CUDA的所有级别和规模上实施高性能矩阵乘法(GEMM)。
它结合了CUTLASS 2.1的策略CUTLASS 2.1-2020年4月CUTLASS是CUDA C ++模板抽象的集合,用于在CUDA内的所有级别和规模上实施高性能矩阵乘法(GEMM)。
它包含类似于用于实现cuBLAS的策略的分层分解和数据移动策略。
CUTLASS将这些“活动部件”分解为由C ++模板类抽象的可重用的模块化软件组件。
这些线程范围,扭曲范围,块范围和设备范围的原始
- 上一篇: 向量组的线性相关性.pdf
- 下一篇: 软件工程思维导图.png