写CUDA到底难在哪?

2025-06-22 11:50:11

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
有哪些是你用上了mac才知道的事?

有哪些是你用上了mac才知道的事?

我终于明白了为什么有的苹果用户会说什么60Hz,120Hz在...

2025-06-26
为什么美国医生看一个病人要半个小时左右,而中国医生五分钟就能看一个?

为什么美国医生看一个病人要半个小时左右,而中国医生五分钟就能看一个?

我师兄,研究生毕业当了不到两年的医生,发际线上移了几厘米,顶...

2025-06-26
kvm是否会增加显示信号的传输延迟,或者键鼠的延迟?打游戏用这个,会影响吗?

kvm是否会增加显示信号的传输延迟,或者键鼠的延迟?打游戏用这个,会影响吗?

KVM一般分为两种,一种是 KVM切换器 ,一种是KVM延长...

2025-06-26
Electron 做游戏客户端的潜力有多大?

Electron 做游戏客户端的潜力有多大?

Electron既不是游戏引擎,也不是新时代,也不会带来变革...

2025-06-26
为什么米哈游不自己搞个***网站?

为什么米哈游不自己搞个***网站?

《信息网络传播视听节目许可证》, 这个是刚性门槛。 大部分...

2025-06-26