verl RL 训练库

授权协议:None操作系统:None 开发语言:None
verl 是一个灵活、高效且可用于生产的 RL 训练库,适用于大型语言模型 (LLM)。 verl 是 HybridFlow:一种灵活高效的 RLHF 框架 论文的开源实现。 verl 灵活且易...