nanoVLM 是用于训练/微调小型视觉语言模型的最简单的代码库,它使用纯 PyTorch 轻量级实现。代码本身非常易读且易于上手,该模型由视觉主干(models/vision_transfor...<
Intern-S1 是一个先进的开源多模态推理模型。在具备强大通用任务能力的同时,在广泛的科学任务中也达到了最先进的性能,可与最先进的闭源商业模型相媲美。 Intern-S1 基于一个 235B...<
Wan:开放且先进的大规模视频生成模型。Wan2.2 是基础视频模型的重大升级,融入以下创新: 高效的 MoE 架构:Wan2.2 在视频扩散模型中引入了混合专家 (MoE) 架构。通过将去噪过...<
GLM-4.5 系列模型是专为智能体应用打造的基础模型,采用混合专家(MoE)架构,包括两个模型: GLM-4.5:总参数量 3550 亿,激活参数 320 亿; GLM-4.5-Air:总参数...<
dify-with-wechat是用于微信公众号对接Dify工作流的开源项目。 功能 支持通过微信公众号对接dify实现智能聊天,支持动态的dify工作流切换,支持连续对话。 支持对接图片识别的...<
Qwen-Agent是一个开发框架,开发者可基于本框架开发Agent应用,充分利用基于通义千问模型(Qwen)的指令遵循、工具使用、规划、记忆能力,旨在帮助开发者快速构建具备指令遵循、工具调用、...<
Qwen Code 是用于 AI 编程的 CLI 工具,修改自 Gemini CLI,针对 Qwen3Coder 系列的模型增强了解析器和工具支持。 使用教程 确保已安装 Node.js 20...<
Qwen3-Coder 是开源 Agentic 编程模型,拥有多个尺寸,当前最强大的版本是 Qwen3-Coder-480B-A35B-Instruct。这是一个总参数量 480B,激活 35B...<
AGNTCY 项目为代理协作提供了完整的基础架构堆栈——可跨任何供应商或框架运行的发现、身份、消息传递和可观察性。它是基础层,可让专业代理相互查找、验证功能并协同解决复杂问题。 AGNTCY 项...<
Skywork-UniPic 代码库包含统一的 1.5B 参数自回归模型的权重和实现,该模型原生地将图像理解、文本转图像生成和图像编辑功能集成在一个架构中。 评估 GenEval Model S...<