HPP_UIUC_MP2: basic matrix multiplication-----BlockDIM!

原创于 2014-04-11 17:52:26 发布 · 858 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

MOOC 专栏收录该内容

8 篇文章

订阅专栏

本文介绍了一个在CUDA编程中遇到的问题：当DimBlock尺寸设置过大时，会导致输出的C矩阵全为零。通过调整DimBlock的大小到合适的范围（例如8x8），可以有效解决该问题并获得正确的计算结果。

部署运行你感兴趣的模型镜像

这次作业有个地方搞的我输出的C矩阵一直都是全000000.

然后发现原来是DimBlock设置的太大了。

//@@ Initialize the grid and block dimensions here
    dim3 DimBlock(8, 8, 1); // if the threads each block is too large, say
			    // 32, then the C output will be all 000000000
	                    // so fail!!!!
    dim3 DimGrid((numCColumns - 1) / DimBlock.x + 1,
                 (numCRows - 1) / DimBlock.y + 1, 1);

这样就可以得到正确结果了。

"level":"Trace",
"message":"The dimensions of B are 64 x 64",
"file":"F:/1MOOC_SourceCode/HPP/libwb/skel/mp2.cu",
"function":"main",
"line":65,
"time":25975425239252
}]
}
,
"solution_exists": true,
"solution":{
"correctq": true,
"message": "Solution is correct."
}
}

F:\1MOOC_SourceCode\HPP\libwb\build\Debug>

您可能感兴趣的与本文相关的镜像

PyTorch 2.5

PyTorch 2.5

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

博客等级

码龄17年

62
原创

12
点赞

33
收藏

30
粉丝

关注

私信

TA的精选

新 poj题目分类 [转载于=小媛在努力原创]
1094 阅读
新转载于[671coder的专栏]
671 阅读
热 Verilog下的图像处理--第二话--downsample
8490 阅读
热 Verilog下的image processing---第一话---读取旋转并写入
6311 阅读
热 SystemVerilog/Verilog的实数输入输出和常数：Cordic或者直接unsynthesizable的C表达
4620 阅读

TA的历史创作历程

分类专栏

thesis 9篇
ctci 34篇
MOOC 8篇
ACM 3篇
leetcode 6篇
openMIPS 1篇
opencl
embedded 2篇
Computer Architecture 1篇
test

展开全部收起

上一篇：: NN之---weight 反馈回路

下一篇：: 段公子 Facebook

AI算力推荐

PyTorch 2.5

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

PyTorch

Cuda

目录

展开全部

收起

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。