SmolLM 多语言长上下文模型

授权协议:None操作系统:None 开发语言:None
SmolLM3是一款在11万亿token上训练的3B参数开源模型,由Hugging Face开源,具备128k长上下文和独特的可切换推理模式,并开源了完整的训练方案。 SmolLM3支持长达12...