Kreuzberg 是一款能从任何文档中提取文本的开源 Python 库,支持 PDF、图像、Word 文档等各种文件格式,自动化提取文本,以便用于检索增强生成(RAG)。 该工具使用简单,且对...<
Fluent M3U8 是一款功能强大的跨平台 M3U8 下载工具,采用 PySide6 和 QFluentWidgets 实现,支持 AES-1280-CBC 解密、多线程并发极速下载、自定义...<
FluentRead 是高效的开源浏览器翻译插件,可以将网页上的文字便捷翻译成任何语言,支持 20+ 种翻译服务,包括谷歌翻译、DeepL 翻译、DeepSeek、OpenAI 等。 主要特性 ...<
Amphion 是开源的音频、音乐和语音生成整合工具包。 主要特性 文本转语音(TTS):高性能,支持主流模型及架构,可生成自然的声音。 歌声转换(SVC):可将某人歌声转换成其他人歌声,内置张...<
VLM-R1 是用强化学习提升视觉理解的大型视觉语言模型。 特性 在视觉指代表达理解任务中,R1模型在域外数据上表现稳定,优于SFT模型 使用Qwen2.5-VL进行训练,性能卓越 提供完整的训...<
LMM-R1 是为多模态任务打造的高性能强化学习训练框架,旨在扩展 OpenRLHF 框架,支持 LMM(Large Multimodal Models)强化学习(RL)训练,以复现 DeepS...<
Scrapling 是一款 Python 网页爬虫库,具有闪电般快速、智能且难以被检测的特点。 特性 提供快速且隐蔽的 HTTP 请求 自适应网站变化,智能追踪元素 性能卓越,比 Beautif...<
本项目是一个基于 Golang 构建的 Telegram 机器人,集成了 DeepSeek API,提供 AI 驱动的智能回复。支持 流式输出,使交互更加自然流畅。 功能特点 ...<
SGLang 是一个针对大语言模型和视觉语言模型的快速服务框架。它通过共同设计后端运行时和前端语言,让你与模型的交互更快、更可控。核心功能包括: 快速后端运行时:通过 RadixAttentio...<
Lucide 是一个开源图标库,提供 1000 多个矢量 (svg) 文件,用于在数字和非数字项目中显示图标和符号。该库旨在通过提供几个官方软件包,让设计师和开发人员更容易将图标整合到他们的项目...<