DeepGEMM FP8GEMM 库

授权协议:None操作系统:None 开发语言:None
DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所述。它支持普通和混合专家(MoE)分组的 GEMM。该库采用...