LeetGPU习题01:Sigmoid手动实现
279 字
1 分钟
LeetGPU习题01:Sigmoid手动实现
术语注释(便于编程理解)
- element-wise addition:逐元素加法(向量中对应位置的数字两两相加)
- function signature:函数签名(函数的名称、参数类型、返回值等固定定义)
- 32-bit floating point numbers:32位浮点数(编程中常用的
float类型)
向量加法例题
难度:简单
编写一个GPU程序,对两个包含32位浮点数的向量执行逐元素加法运算。程序需接收两个等长的输入向量,并输出一个存储二者求和结果的向量。
实现要求
- 禁止使用任何外部库
solve函数的签名必须保持不变- 最终计算结果必须存储在向量
C中
示例1
输入:A = [1.0, 2.0, 3.0, 4.0] B = [5.0, 6.0, 7.0, 8.0] 输出:C = [6.0, 8.0, 10.0, 12.0]
示例2
输入:A = [1.5, 1.5, 1.5] B = [2.3, 2.3, 2.3] 输出:C = [3.8, 3.8, 3.8]
约束条件
- 输入向量A和B的长度完全相同
- 向量长度
N的取值范围:1 ≤ N ≤ 100,000,000 - 程序性能将基于向量长度
N = 25,000,000进行评估
支持与分享
如果这篇文章对你有帮助,欢迎分享给更多人或赞助支持!
LeetGPU习题01:Sigmoid手动实现
https://dlog.com.cn/posts/leetgpu02/vector_add/