SGLang 大模型推理框架

授权协议:None操作系统:None 开发语言:None
SGLang 是一个针对大语言模型和视觉语言模型的快速服务框架。它通过共同设计后端运行时和前端语言,让你与模型的交互更快、更可控。核心功能包括: 快速后端运行时:通过 RadixAttentio...