CUDA 基础
基础概念
SM 全称 Streaming Multiprocessor,流式多处理器,是 NVIDIA GPU 的核心计算单元,采用 SIMT(单指令多线程)架构。SM 负责执行 CUDA 内核,包含 CUDA 核心(执行单元)、寄存器、共享内存和 Warp 调度器,将线程块(Thread Blocks)分发到可用的 SM 上并行执行,直接决定 GPU 的算力与吞吐量。
SM 全称 Streaming Multiprocessor,流式多处理器,是 NVIDIA GPU 的核心计算单元,采用 SIMT(单指令多线程)架构。SM 负责执行 CUDA 内核,包含 CUDA 核心(执行单元)、寄存器、共享内存和 Warp 调度器,将线程块(Thread Blocks)分发到可用的 SM 上并行执行,直接决定 GPU 的算力与吞吐量。