网站地图官方微信:
网站首页 兴安镇 桑村镇 岩镇镇 邓双镇 嘎娘乡 崔久乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 小米 AI 眼镜发布,售价 1999 元起,有哪些功能亮点?你看好其市场前景吗? |

    作为少数同时拥有两款AI眼镜的男人(Meta和雷鸟V3), ...

    查看详情>>
  • | 如何评价董宇辉讲述“各地厅长甚至更大的领导来我们这,站在门口等,站一个多小时。”? |

  • | 如何评价 Next.js? |

  • | 如何评价前端框架 Solid? |

  • | 如何看待西安地铁3号线近期的降速行为? |

  • | 操作系统能否知道自己处于虚拟机中? |

  • | 你们的初中生活是怎样的? |

  • | 为什么大多数评测对macbook的屏幕素质避而不谈?当真不怕被pwm频闪闪瞎眼吗? |

  • | 怎么看待三十而已里说的养鱼让人玩物丧志,养鱼是魔鬼,是黑洞,养鱼毁三代鱼缸毁一生的话? |

  • | 什么叫「对复杂系统保持最基本的敬畏」? |

  • | 为什么 Apple 的开发者群体总是会积极响应 Apple 的各类技术变动? |

  • 因为傻,因为侥幸心理,因为连condom这个伟大的发明都懒得...

    2025-06-28
  • 厨子平凡……厨子平凡的只有颜值。 按诛仙的时间线设定,宋大...

    2025-06-28
  • 15年,我们小区交房,刚开始车位卖10w一个。 地上车位只...

    2025-06-28
  • 0008三种改变命运之法 改变命运有三种方式:出生、嫁娶、奋...

    2025-06-28

关注我们

添加微信好友,关注最新动态