FlagAttention 大模型高性能 Triton 算子集

授权协议:None操作系统:None 开发语言:None
FlagAttention 是一个用 Triton 语言实现的内存高效 Attention 算子项目。FlagAttention 由语言模型中对非标准 attention 算子的需求驱动,对 m...