资源介绍
CUDA中文手册
NVIDIA CUDA
统一计算设备架构
编程指南
第1章 CUDA简介
1.1 作为数据并行计算设备的图形处理器
1.2 CUDA:一种GPU计算的新架构
1.3 文档结构
第2章 编程模型
2.1 高度多线程协处理器
2.2 线程分批
2.2.1 线程块
2.2.2 线程块网格
2.3 内存模型
第3章 硬件实现
3.1 具有片上共享内存的一组SIMD多处理器
3.2 执行模型
3.3 计算能力
3.4 多个设备
3.5 显示模式切换
第4章 应用编程接口
4.1C编程语言扩展
4.2 语言扩展
4.2.1函数类型限定符
4.2.2变量类型限定符
4.2.3执行配置
4.2.4内置变量
4.2.5 使用NVCC编译
4.3 共用运行时组件
4.3.1内置向量类型
4.3.2数学函数
4.3.3 时间函数
4.3.4 纹理类型
4.4设备运行时组件
4.4.1数学函数
4.4.2 同步函数
4.4.3 类型转换函数
4.4.4类型强制函数
4.4.5纹理函数
4.4.6原子函数
4.5宿主运行时组件
4.5.1常用概念
4.5.2运行时API
4.5.3 驱动程序API
第5章性能指南
5.1 指令性能
5.1.1 指令吞吐量
5.1.2内存带宽
5.2 每块的线程数
5.3 宿主和设备之间的数据传送
5.4 纹理拾取与全局或常量内存读取
5.5 整体性能优化策略
第6章 矩阵乘法示例
6.1概述
6.2 源码清单
6.3 源码攻略
6.3.1Mul()
6.3.2Muld()
附录
- 上一篇: Nvidia官方cuda 参考手册
- 下一篇: 计算统一设备架构---NVIDIA CUDA