DeepChat - 连接强大AI与个人世界的智能助手 主要特性 支持多个模型云服务:DeepSeek、OpenAI、硅基流动等 支...<
DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所述。它支持普通和混合专家(MoE)分组的 GEMM。该库采用...<
Wan2.1 是一套全面而开放的视频基础模型,它突破了视频生成的界限。Wan2.1提供以下主要功能: SOTA 性能:Wan2.1在多个基准测试中始终优于现有的开源模型和最先进的商业解决方案。 ...<
Zoraxy 是一款通用 HTTP 反向代理和转发工具。 特点: 易于使用、适合新手的反向代理服务器,可使用 Web 表单和一些切换开关轻松设置。 直接直观的重定向规则,具有基本的重写选项。适用...<
Browser use 旨在将 AI 代理与浏览器自动化操作结合起来。 特点: 强大的浏览器自动化:浏览器使用将先进的 AI 功能与强大的浏览器自动化相结合,使 AI 代理能够无缝进行网络交互。...<
本项目是一个面向小白开发者的大模型应用开发教程,旨在基于阿里云服务器,结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,主要内容包括: 大模型简介,何为大模型、大模型特点是什么、La...<
DrawDB 是一个免费的在线开源数据库图表编辑器,你可以在其中可视化你的 schema、共享你的图表、导出 SQL 脚本、对 DDL 脚本进行逆向工程等等。 Local Development...<
Granite 是一系列专为商业设计的 AI 模型,从头开始设计,以确保 AI 驱动应用程序的信任度和可扩展性。Granite 3.2 模型利用了新的密集架构。这些模型使用 12 种语言和 11...<
Profiling Data in DeepSeek Infra 是来自训练和推理框架的分析数据,以帮助社区更好地了解通信计算重叠策略和低级实现细节。 GitHub 上注明,分析数据是使用 Py...<
EPLB (Expert Parallelism Load Balancer) 是适用于 V3/R1 的专家并行负载均衡器,解决 MoE 模型在分布式训练和推理中的负载不均衡问题。 在 MoE ...<