CUDA Performance Tips

最新推荐文章于 2022-09-01 15:06:12 发布

G_fans

最新推荐文章于 2022-09-01 15:06:12 发布

阅读量672

点赞数

分类专栏： CUDA 文章标签： CUDA Performance memory lookup tables

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/niexiao2008/article/details/17999895

版权

CUDA 专栏收录该内容

8 篇文章

订阅专栏

本文探讨了在GPU上进行计算时的内存优化策略，特别是关于查找表的使用。建议避免将查找表放在GPU上以减少内存带宽的压力，因为随着GPU代际的发展，FLOPS的增长速度超过了内存带宽。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Tips:

1. CUDA memory for lookup tables:

It may be best not to use any tables on the GPU at all (see also CUDA math library), as FLOPS are increasing faster than memory bandwidth across GPU generations.

博客等级

码龄18年

31
原创

8
点赞

18
收藏

18
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

SPH fluid simulation methods & source codes (cpu & gpu)
summer2day: 您好，我想问下代码里有cci文件，这是干嘛？为什么不写在cpp里
SPH fluid simulation methods & source codes (cpu & gpu)
Dchange: 小妹最近也在钻研这方面的东西，但是水平尚浅，知乎已留言，但是不知大神是否常看知乎，所以这里也留个言，读代码时有一点细节问题，还望不吝赐教，望答复，谢谢！
Physics-Based Animation learning notes
ljb1672: 1、在优快云上难得找到对物理模拟深入的大神。想问句，博主的论文是关于SPH的？能否透露下内容供学习。 2、感觉刚体模拟的LCP方法比PBD（Position Based Dynamics）更复杂些。 3、咨询下，PDB模拟流体中，边界如何处理。Akinci的论文不是太理解。
SPH fluid simulation methods & source codes (cpu & gpu)
x532425411: 楼主，能加你的qq请教一下吗？
Physics-Based Animation learning notes
jiuyaoshuo: 为了multiple impacts买了PBA，可惜有点失望。就物理来看，LCP或者gap function基本扯谈（PBA上也有说），Gauss-Seidel问题很大（Ivanov A.P. On multiple impacts)，坚持刚体模型的话有一篇文章，用黎曼度量最小值来弄，不过就像文章中自己说，三体以上问题没办法证明解的唯一性。要是抛弃刚体模型的话，那也有很多麻烦，因为即使是经典的赫兹接触，线性理论也不适用，更不用说应力波的作用。有限元也是从为非光滑力学系统出发来做的，那就直接向量场不可微了。从correlation ratio出发也有好几篇文章，首先就说明牛顿摆这一模型未必是你想象得那样，不过总感觉给出correlation ratio方法的理论依据不足。也不知道是这个问题实在太难还是没人关注，找文章都有点困难，非光滑力学系统的有限元方法没试过，而且难度有点大，不知行不行，即使行，实时你也基本别想了。 P.S PBA里的碰撞检测算法说的v-clip这点有点坑，因为v-clip有专利，所以很多开源库都用GJK，不知道OpenTissue是不是在用v-clip，就不怕像当年卡马克一样被迫重写？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。