Slime RL LLM 后训练框架

授权协议:None操作系统:None 开发语言:None
slime 是为 RL scaling 设计的 LLM posttraining 框架,提供两大核心能力: 高性能训练:通过连接 Megatron 与 SGLang,支持各种模式的高效训练; ...