三言科技消息 上周,DeepSeek宣布将于本周连续开源5个代码库。今天上午开源了首个代码库FlashMLA。
FlashMLA是针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计,其灵感来自FlashAttention 2&3和cutlass项目。该代码库目前已投入生产。
三言科技发现,在GitHub上该项目已经收获了超过5500个Star收藏,并且拥有235个Fork(副本创建)。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货