C/C++需要知道的知识点#

在学习 CUDA 之前，我们需要回顾一些 C/C++ 中被 Java/Python 使用者常常忽视、却对 GPU 编程至关重要的知识点。其中最核心的就是指针与内存管理。

本文不会逐条详细讲解，而是列出一张知识地图，并推荐高质量的学习资料。你可以根据自己的薄弱环节，按图索骥，并在后续 CUDA 学习中遇到相关概念时回过头来查阅。

Tip

如果你是 Java/Python 背景，请特别关注内存布局、编译链接、数据排布等章节。它们在你以往的开发中可能很少接触，但在 CUDA 中会高频出现。

Warning

个人认为AI最好的使用方式还是纠错。你需要自己写代码，写内容，然后让AI帮助你去检查是否具有逻辑性错误和常识性错误，而不是直接让AI生成。否则AI会极大地破坏你思维的连贯性，让自己的思考退化。（为什么这么说？因为我就是这样子退化的😭）

OK言归正传。

无任何广告，请放心食用

阅读提示

下边的每个知识点都配了博客，建议不要一次性看完，而是在CUDA学习中遇到相关的概念时在回来查阅效果更好。

一、内存与数据#

CUDA 编程中，内存模型是性能的关键。你需要清楚地理解数据的存储位置、生命周期以及访问方式。

知识点	在 CUDA 中的重要性	推荐资料
指针	GPU 编程中频繁操作设备内存，必须区分主机指针与设备指针	C指针基本概念，C语言指针进阶，C++智能指针
堆与栈	了解哪些数据放在寄存器/栈（局部变量），哪些需要动态分配（全局内存）	Stack与Heap的区别
内存对齐	对齐直接影响全局内存的合并访问，错误的对齐会降低带宽	结构体内存对齐，C/C++结构体及其数组对齐
静态与动态存储	CUDA 中常量内存、全局内存的分配与作用域	C语言数据存储分类
类型转换与字节序	设备与主机间数据传输时需注意字节序一致	C大小字节序转换，C++类型转换
CUDA 内存模型	必学：每种内存的访问速度、容量、生命周期和使用场景	（后续文章会详细讲解）

二、编译与构建#

CUDA 程序由主机代码（C++）和设备代码（CUDA C++）组成，编译过程比普通 C++ 更复杂。理解这些概念能帮你快速解决环境配置和链接错误。

知识点	说明	在 CUDA 中的重要性	推荐资料
宏与预处理	`#define`、条件编译、`#pragma`	常用于定义 kernel 的模板参数、调试开关	C语言宏定义完整指南
编译链接过程	预处理、编译、汇编、链接；符号解析	CUDA 使用 `nvcc` 编译器，理解分离编译对混合编程很重要	C/C++编译链接详解
Makefile / CMake	构建工具的使用	CUDA 项目通常需要自定义构建规则，CMake 对 CUDA 有良好支持	廖雪峰的Makefile教程，CMake Tutorial，CMake入门系列

三、抽象与设计#

良好的抽象能让你写出更易维护、可复用的 CUDA 代码。这一部分知识在普通 C++ 开发中也很重要，但在 CUDA 中会直接影响性能。

知识点	说明	在 CUDA 中的重要性	推荐资料
泛型编程（模板）	函数模板、类模板、模板特化	同一份 kernel 代码可以适配不同数据类型（如 `float`、`half`）和不同 block 尺寸	C++模板编程：从初阶到进阶
数据排布：AoS vs SoA	结构体数组 vs 数组结构体	核心优化技巧：SoA 更利于 GPU 的合并访问，能显著提升带宽利用率	优化数据排布，让你的程序加速4倍！
仿函数与 Lambda	函数对象、匿名函数	用于封装 kernel 中的计算逻辑，便于将策略与循环分离	一文读懂C++11的Lambda表达式
CUDA 函数修饰符	`__global__`、`__device__`、`__host__`	必学：区分核函数、设备端辅助函数、主机端函数	（后续文章会详细讲解）

四、并发与异步#

GPU 是高度并行的设备，理解并发与并行的概念，以及如何在代码中实现细粒度的并行控制，是写好 CUDA 程序的前提。

知识点	说明	在 CUDA 中的重要性	推荐资料
并发与并行的本质区别	并发是逻辑上的同时发生，并行是物理上的同时执行	GPU 通过大量线程实现数据并行，理解这点才能设计出高效的线程层次结构	（可自行搜索，后续文章会结合 CUDA 讲解）
原子操作	对共享变量的不可分割操作，如 `atomicAdd`	当多个线程同时更新同一内存位置时必须使用原子操作，否则会产生数据竞争	（后续文章会讲解）
异步编程	不等待操作完成即可继续执行	CUDA 中的流（stream）、异步内存拷贝，是隐藏数据传输延迟的关键	（后续文章会讲解）
向量化指令	使用向量类型（如 `float4`、`int4`）一次处理多个数据	可以提高内存带宽利用率，减少指令数，是优化访存的常用技巧	（后续文章会讲解）

Note

本节列出的知识点在 CUDA 中都有非常具体的实现方式。由于篇幅限制，本文只介绍概念与对应的一些入门博客，具体用法将在本系列的后续文章中详细展开。

后言#

一口气看到这么多知识点，是不是有点头大？
这些内容确实不少，如果每个都深究，十几个小时可能都打不住。

这里列出的不是“学前必背清单”，而是一张索引表。
你完全不需要一次性把它们全部学透——只需要先大致了解，在后续的 CUDA 学习中，遇到哪个概念再回过头来翻一翻、写几行代码验证一下。

Less read, More code!!

哪怕只是十几行的小例子，也比直接复制粘贴跑通一个复杂项目更有价值。因为自己写的过程，才是把黑盒变成白盒的过程。

如果写的时候遇到 bug，那正是 AI 工具派上用场的好机会。让它帮你分析错误，而不是替你写代码，这样子效率会大大提升。

学习的路上，慢一点没关系，哪怕一次只搞懂一个知识点，也是进步。

我们下一篇见～

Important

如果你对某个知识点有疑问，欢迎在评论区留言，我会根据反馈调整后续文章的深度。

音乐

音乐

C/C++需要知道的知识点#

一、内存与数据#

二、编译与构建#

三、抽象与设计#

四、并发与异步#

后言#

支持与分享

音乐

目录

音乐

音乐

CUDA学习之路2——你需要哪些C/C++的知识呢？

C/C++需要知道的知识点#

一、内存与数据#

二、编译与构建#

三、抽象与设计#

四、并发与异步#

后言#

支持与分享

音乐

目录