CUDA C++最佳实践指导
¶
欢迎来到 CUDA C++ Best Practices Guide 的中文翻译页面。
10. 内存优化
10.1 主机与设备间数据传输
10.1.1 固定内存(Pinned Memory)
10.1.2 计算与内存传输的异步和重叠
10.1.3 零拷贝内存(Zero Copy)
10.2 设备内存空间
10.2.1 全局内存的合并访问(Coalesced Access to Global Memory)
10.2.1.1 简单访问模式
10.2.1.2 顺序但未对齐的访问模式
10.2.1.3 未对齐访问的影响
10.2.1.4 跨步访问(Strided Accesses)
全局内存合并访问的附加说明:
10.2.2 共享内存(Shared Memory)
10.2.2.1 共享内存和存储体(Shared Memory and Memory Banks)
10.2.3 本地 / 局部内存(Local Memory)
10.2.4 纹理内存(Texture Memory)
10.2.5 常量内存(Constant Memory)
CUDA中文手册
导航
目录
CUDA C++最佳实践指导
10. 内存优化
CUDA C++编程指南
Related Topics
Documentation overview
Previous:
项目首页
Next:
10. 内存优化