LeetGPU习题03:Color inversion
题目描述给定一张图像的 RGBA 数据,以一维数组形式存储。每个像素由四个 8 位无符号整数(unsigned char)组成,依次为 R(红)、G(绿)、B(蓝)、A(透明度)。颜色反转的规则:将每个像素的 R、G、B 分量用 255 减去原值,A 分量保持不变。数组 image 的长度为 width * height * 4,依次存放所有像素的 RGBA 值(左上角像素为前 4 个元素)。
Cover Image of the Post
CUDA学习之路[7]:详解oneflow的element_wise代码
向量化+自适应网格+编译期多态。
LeetGPU习题02:Matrix Copy
实现一个程序,在 GPU 上将输入矩阵 A 中的 32 位浮点数按元素直接复制到输出矩阵 B。即对于所有有效下标 (i, j),满足 B[i][j] = A[i][j]。
Cover Image of the Post
LeetGPU习题01:Matrix Addition
在 LeetGPU 的习题列表中,Element-wise 算子指的是对输入张量/数组的每个元素独立执行相同操作、不依赖于其他元素或全局统计量的算子。
Cover Image of the Post
CUDA学习之路[6]:PyTorch CUDA 扩展完全指南
从零掌握在 PyTorch 中调用 CUDA 代码的多种方式,理解 JIT 编译与预编译的权衡,并深入整合自动微分。
Cover Image of the Post
mytorch[1]:自己实现mytorch
mytorch是你所需要的
Triton学习之路[2]:Triton与Pytorch如何结合?
不仅仅要前向传播,还要反向传播。
CUDA学习之路[5]——逐元素操作算子
最基础的一系列算子:element-wise。
Cover Image of the Post
Triton学习之路[1]:掌握模板代码
学习并掌握Triton的模板代码
Cover Image of the Post
Fresh现代编辑器
或许你是时候该换一款更加现代的编辑器了
Cover Image of the Post
Profile Image of the Author
杜子源
都是风景,幸会
公告
请狠狠地打赏我,打赏一次,爆更一篇!!
音乐
封面

音乐

暂未播放

0:00 0:00
暂无歌词
分类
标签
站点统计
文章
17
分类
6
标签
8
总字数
27,300
运行时长
0
最后活动
0 天前

目录