VLM-R1 强化学习增强的大型视觉语言模型

授权协议:None操作系统:None 开发语言:None
VLM-R1 是用强化学习提升视觉理解的大型视觉语言模型。 特性 在视觉指代表达理解任务中,R1模型在域外数据上表现稳定,优于SFT模型 使用Qwen2.5-VL进行训练,性能卓越 提供完整的训...