WorldPM 偏好建模模型

授权协议:None操作系统:None 开发语言:None
WorldPM(世界偏好建模)证明了偏好建模遵循与语言建模类似的扩展规律。通过对1500万条偏好数据进行大规模训练,发现偏好模型能够学习统一的偏好表示。 主要发现 在对抗性评估中,测试损失呈现幂...