CUDA C++最佳实践指导¶

欢迎来到 CUDA C++ Best Practices Guide 的中文翻译页面。

  • 10. 内存优化
    • 10.1 主机与设备间数据传输
      • 10.1.1 固定内存(Pinned Memory)
      • 10.1.2 计算与内存传输的异步和重叠
      • 10.1.3 零拷贝内存(Zero Copy)
    • 10.2 设备内存空间
      • 10.2.1 全局内存的合并访问(Coalesced Access to Global Memory)
        • 10.2.1.1 简单访问模式
        • 10.2.1.2 顺序但未对齐的访问模式
        • 10.2.1.3 未对齐访问的影响
        • 10.2.1.4 跨步访问(Strided Accesses)
          • 全局内存合并访问的附加说明:
      • 10.2.2 共享内存(Shared Memory)
        • 10.2.2.1 共享内存和存储体(Shared Memory and Memory Banks)
      • 10.2.3 本地 / 局部内存(Local Memory)
      • 10.2.4 纹理内存(Texture Memory)
      • 10.2.5 常量内存(Constant Memory)

CUDA中文手册

导航

目录

  • CUDA C++最佳实践指导
    • 10. 内存优化
  • CUDA C++编程指南

Related Topics

  • Documentation overview
    • Previous: 项目首页
    • Next: 10. 内存优化
©2025, bi-an. | Powered by Sphinx 8.2.3 & Alabaster 1.0.0 | Page source