LMM-R1 高性能强化学习训练框

授权协议:None操作系统:None 开发语言:None
LMM-R1 是为多模态任务打造的高性能强化学习训练框架,旨在扩展 OpenRLHF 框架,支持 LMM(Large Multimodal Models)强化学习(RL)训练,以复现 DeepS...