rLLM 强化学习 LLM

授权协议:None操作系统:None 开发语言:None
rLLM 是一个开源项目,旨在完全推广强化学习(RL)给 LLMs,并在真实任务上大规模重现 DeepSeek R1 和 OpenAI o1/o3。 对于所有版本,开源的内容包括训练脚本(包括超...