登录 注册
当前位置:主页 > 资源下载 > 15 > CUDA模板下的C/C++线性代数子例程开发

CUDA模板下的C/C++线性代数子例程开发

  • 更新:2024-08-01 22:22:02
  • 大小:15.2MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:其它 - 开发技术
  • 格式:ZIP

资源介绍

CUTLASS 2.1 CUTLASS 2.1-2020年4月CUTLASS是CUDA C ++模板抽象的集合,用于在CUDA的所有级别和规模上实施高性能矩阵乘法(GEMM)。 它结合了CUTLASS 2.1的策略CUTLASS 2.1-2020年4月CUTLASS是CUDA C ++模板抽象的集合,用于在CUDA内的所有级别和规模上实施高性能矩阵乘法(GEMM)。 它包含类似于用于实现cuBLAS的策略的分层分解和数据移动策略。 CUTLASS将这些“活动部件”分解为由C ++模板类抽象的可重用的模块化软件组件。 这些线程范围,扭曲范围,块范围和设备范围的原始