DeepSeek开源周启动,发布FlashMLA助推GPU算力极限
2月24日,DeepSeek正式启动“开源周”,计划连续五天每天开源一个项目。首个开源项目为FlashMLA,这是一个针对英伟达Hopper架构GPU优化的高效MLA解码内核,对H800芯片的内存带宽提升效果显著。在优化后,H800的内存带宽可以达到3000 GB/s。这一性能表现是传统方法的2到3倍,并且远超H800芯片的理论带宽上限(600 GB/s)。这意味着FlashMLA能够极大地提升H800在内存受限场景下的性能表现,它被认为将重塑AI推理效率的天花板。(第一财经)
往期推荐
- 人民日报:抢抓人工智能发展的历史性机遇2025-02-25
- 广州尝试新的风险容忍机制,单项目最高允许100%亏损2025-02-24
- DeepSeek开始引发公募基金展业变局2025-02-24