杜子源的博士居 - 首页

找不到相关结果。

主题色相

250

壁纸模式

横幅设置

文章布局

杜子源

都是风景，幸会

请狠狠地打赏我，打赏一次，爆更一篇！！

CUDA学习之路 14 习题 7 Triton 2 使用工具 2 mytorch 1 入门资料汇总 1 存算一体 1 未分类 1

CUDA学习之路[13]：Attention算子详解

2026-06-25

CUDA学习之路

市面上讲解Transformer架构的博客、视频、书籍实在是太多了，我不敢保证自己真的能够讲的比这些大牛都优秀，只能说尽量把我对于Transformer的全部理解都写在这一个系列博客中。

#CUDA #Triton #PyTorch

Cover Image of the Post

CUDA学习之路[12]：卷积计算详解

2026-06-12

CUDA学习之路

完整的代码仓库在这里，希望对大家有所帮助和收获，希望大家多多Star！

#CUDA #Triton #PyTorch

Cover Image of the Post

LeetGPU习题07：Norm系列代码实现

2026-06-12

BN、LN、RMS的CUDA、Triton以及Pytorch实现

Cover Image of the Post

CUDA学习之路[11]：矩阵乘法计算详解

2026-06-11

CUDA学习之路

无论是卷积层、全连接层还是注意力计算，最终都会归因到矩阵运算。无论是C语言还是CUDA亦或者是numpy、pytorch，都有一大堆针对矩阵运算来进行优化的库，这也是我们AI Infra真正意义上的起点，跟随着我的视角，我们来完整的体会一下是如何优化的。

#CUDA #Triton #PyTorch

Cover Image of the Post

LeetGPU习题06：Norm系列详解

2026-05-22

详细梳理Normalization方法的发展脉络、数学原理与设计动机，以及CUDA、Triton与Pytorch实现

Cover Image of the Post

CUDA学习之路[10]：扫描算法详解

2026-05-13

CUDA学习之路

Scan 又称为Prefix Sum，是并行计算中最基础也最重要的collective原语之一。

#CUDA #Triton #PyTorch

Cover Image of the Post

LeetGPU习题05：Softmax优化详解

2026-05-11

详细总结Softmax的概念及其所有的优化版本（预计万字）

Cover Image of the Post

存算一体专栏[1]：追哪些会/刊？

2026-05-09

总结存算可以投的会

Awesome AI Infra

2026-05-09

入门资料汇总

入门资料汇总

Cover Image of the Post

LeetGPU习题04：Reduce汇总

2026-05-09

总结LeetGPU中所有和Reduce算子相关的内容

Cover Image of the Post

杜子源

都是风景，幸会

请狠狠地打赏我，打赏一次，爆更一篇！！

Awesome CUDA LeetGPU mytorch PIM PyTorch Tool Triton 图片处理实用工具文件配置

文章

29

分类

8

标签

11

总字数

93,152

运行时长

0 天

最后活动

0 天前

目录