Skip to content

CUDA 基础

基础概念

SM 全称 Streaming Multiprocessor,流式多处理器,是 NVIDIA GPU 的核心计算单元,采用 SIMT(单指令多线程)架构。SM 负责执行 CUDA 内核,包含 CUDA 核心(执行单元)、寄存器、共享内存和 Warp 调度器,将线程块(Thread Blocks)分发到可用的 SM 上并行执行,直接决定 GPU 的算力与吞吐量。

参考文档