
AI开源
文章平均质量分 84
小众AI
发现和分享高赞实用的AI开源软件。官网:https://www.aiinn.cn
展开
-
AutoAgent: 香港大学开源的AI智能体框架
AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基础。该框架支持多种大语言模型(LLM),如Grok、Gemini等,并具备高性能的多智能体协作系统,在GAIA基准测试中表现优异,媲美OpenAI的Deep Research。原创 2025-04-07 10:10:54 · 533 阅读 · 0 评论 -
agno: 轻量级的多模态智能代理库
一个高性能、开源的 Python 库,用于构建多模态智能代理。通过统一大语言模型的 API,并赋予它们记忆、知识、工具和推理等强大功能。该项目速度快、内存占用少,支持文本、图像、音频和视频等多种内容形式,以及多代理、结构化输出,兼容几乎任何模型和服务供应商。原创 2025-04-04 10:14:55 · 307 阅读 · 0 评论 -
OmniParser: 让大模型化身“电脑管家”
微软发布了革命性的视觉Agent框架OmniParser V2。这个能把DeepSeek-R1、GPT-4o等大模型变成"计算机使用智能体"的黑科技,让AI终于不再只是"脑补"屏幕内容——它现在能像人类一样精准识别UI元素,甚至能发现你都没注意到的隐藏按钮!原创 2025-04-02 11:31:37 · 794 阅读 · 0 评论 -
ivy: 机器学习代码跨框架转换利器
可以将机器学习模型、工具和库从一个框架转换到另一个框架。开发者通过简单的函数即可完成代码的转换,支持 TensorFlow、PyTorch、JAX 等主流框架。原创 2025-03-31 09:12:21 · 669 阅读 · 0 评论 -
PySpur: AI 智能体可视化开发平台
PySpur是一个开源的轻量级可视化AI智能体工作流构建器,旨在简化AI系统的开发流程。通过拖拽式界面,用户可以快速构建、测试和迭代AI工作流,无需编写复杂代码。PySpur支持多模态数据处理、RAG技术、文件上传和结构化输出,适用于智能对话系统开发、自动化任务管理、多模态数据分析和文档处理等场景。原创 2025-03-30 10:33:56 · 817 阅读 · 0 评论 -
Ableton-MCP: 让音乐制作更智能
AbletonMCP 通过模型上下文协议 (MCP) 将 Ableton Live 连接到 Claude AI,使 Claude 能够直接与 Ableton Live 交互和控制。此集成支持提示辅助音乐制作、音轨创建和 Live 会话作。原创 2025-03-27 09:52:25 · 972 阅读 · 0 评论 -
DeepSearcher: 私有数据上智能搜索和分析
DeepSearcher 结合推理 LLM(OpenAI o1、o3-mini、DeepSeek、Grok 3、Claude 3.7 Sonnet 等)和向量数据库(Milvus、Zilliz Cloud 等),基于私有数据进行搜索、评估和推理,提供高度准确的答案和全面的报告。本项目适用于企业知识管理、智能问答系统、信息检索场景。原创 2025-03-26 09:15:19 · 820 阅读 · 0 评论 -
ai-by-hand-excel: 用 Excel 手搓各种 AI 算法和模型
通过 Excel 的形式实现并演示人工智能与深度学习的核心算法和概念,让初学者可以动手操作并理解 AI 的运行原理,包括矩阵乘法、MLP、RNN、Transformer、ResNet 等,以独特且浅显易懂的形式,降低了 AI 学习的门槛。原创 2025-03-24 10:31:38 · 502 阅读 · 0 评论 -
Second-Me: 训练你的 AI 自我以连接世界
不像像 OpenAI 这样的公司构建了威胁人类独立的“超级 AI”。而是渴望个性:AI 可以放大而不是抹杀您。通过Second Me来挑战这一点:一个开源原型,您可以在其中打造自己的AI 自我 — 一种新的 AI 物种,可以保护您、提供您的背景并捍卫您的利益。原创 2025-03-23 11:47:02 · 480 阅读 · 0 评论 -
OWL - 优化劳动力学习的通用智能体
🦉 OWL 是一个前沿的多智能体协作框架,推动任务自动化的边界,构建在 CAMEL-AI Framework。愿景是彻底变革 AI 智能体协作解决现实任务的方式。通过利用动态智能体交互,OWL 实现了跨多领域更自然、高效且稳健的任务自动化。🏆 OWL 在 GAIA 基准测试中取得 58.18 平均分,在开源框架中排名 🏅️ #1! 🏆原创 2025-03-21 09:42:19 · 902 阅读 · 0 评论 -
MarkPDFDown - 使用 AI 将 PDF 转录为 Markdown
MarkPDFDown 旨在简化将 PDF 文档转换为干净、可编辑的 Markdown 文本的过程。通过利用先进的多模态 AI 模型,它可以准确提取文本、保留格式并处理复杂的文档结构,包括表格、公式和图表。原创 2025-03-20 09:32:34 · 989 阅读 · 0 评论 -
Open-Sora - 为所有人实现高效的视频制作大众化
这是一款开源的 SOTA(State-of-the-Art)视频生成模型,仅用 20 万美元(224 张 GPU)就能训练出商业级 11B 参数的视频生成大模型。它采用 Python 语言和 PyTorch 深度学习框架开发,具有生成速度快、资源消耗低、扩展性强等优势,适合内容创作者、广告制作者和社交媒体运营人群使用。目前,已全面开源模型权重、推理代码及分布式训练全流程。原创 2025-03-17 09:44:21 · 630 阅读 · 0 评论 -
cherry-studio - 多模型支持的跨平台 AI 桌面助手
一款支持多种大语言模型服务的跨平台桌面客户端,兼容 Windows、Linux 和 macOS 系统。它支持主流云端模型(如 OpenAI、Anthropic 等)以及本地模型(如 Ollama、LM Studio),能够满足文本生成、翻译、问答以及数据处理等多种需求。同时,内置超过 300 个预配置的 AI 助手,支持自定义创建并支持多模型同时对话,方便用户对比不同模型的结果。原创 2025-03-15 11:05:21 · 381 阅读 · 0 评论 -
SwanLab - 轻量的 AI 模型训练跟踪与可视化工具
SwanLab 是一款开源、轻量的 AI 模型训练跟踪与可视化工具,提供了一个跟踪、记录、比较、和协作实验的平台。原创 2025-03-13 11:24:10 · 747 阅读 · 0 评论 -
TrendPublish - 全自动 AI 内容生成与发布
实时追踪和发布人工智能领域的最新趋势。帮助开发者、技术爱好者和研究人员快速获取 AI 领域的动态信息,例如前沿技术、热门项目和行业新闻等。通过自动化收集和整理数据,用户可以轻松掌握 AI 生态的最新动向。项目依托 GitHub 平台,鼓励社区参与贡献代码或提出改进建议,适合对 AI 发展感兴趣的用户使用。当前项目处于开发阶段,功能仍在完善中,但已展现出其在技术趋势分析中的潜力。原创 2025-03-12 15:19:53 · 310 阅读 · 0 评论 -
autoMate - AI实现电脑任务自动化的本地工具
autoMate 是一款由开源开发的本地自动化工具,以 AI+RPA(人工智能+机器人流程自动化)为核心特色。它将大型语言模型的智能理解与 RPA 的流程执行能力结合,用户只需用自然语言描述任务,如“整理桌面文件”或“生成周报”,即可让电脑自动完成复杂操作。工具支持本地部署,保障数据安全,特别适合需要高效处理重复性任务的个人或团队。autoMate 打破传统 RPA 的复杂规则设置,通过 AI 驱动的直观交互,让自动化更智能、更易用。原创 2025-03-10 10:52:48 · 3347 阅读 · 0 评论 -
OpenManus - 无需邀请码即可实现任何创意的Manus
Manus 非常棒,但 OpenManus 无需邀请码即可实现任何创意 🛫 !原创 2025-03-08 11:24:04 · 898 阅读 · 0 评论 -
anx-reader - 集成多种 AI 能力的阅读器
Anx Reader,一款为图书爱好者精心打造的电子书阅读器。它具有强大的 AI 功能并支持各种电子书格式,使阅读更智能、更专注。凭借其现代的界面设计,我们致力于提供纯粹的阅读乐趣。原创 2025-03-06 10:42:37 · 769 阅读 · 0 评论 -
Oumi - 一站式构建基础模型
Oumi 是一个完全开源的平台,可简化基础模型的整个生命周期 - 从数据准备和训练到评估和部署。无论您是在笔记本电脑上进行开发、在集群上启动大规模实验,还是在生产环境中部署模型,Oumi 都能提供您所需的工具和工作流程。原创 2025-03-04 11:21:17 · 770 阅读 · 0 评论 -
story-flicks - AI大模型一键生成高清故事短视频
可以输入一个故事主题,使用大语言模型生成故事视频,视频中包含大模型生成的图片、故事内容,以及音频和字幕信息。项目后端技术栈为 python + fastapi 框架,前端为 react + antd + vite。原创 2025-03-02 09:51:03 · 1073 阅读 · 0 评论 -
watermark-removal - 去除图片水印的AI工具
使用基于机器学习的图像修复方法从图像中去除水印,这与图像的真实版本完全没有区别。原创 2025-02-28 11:09:32 · 451 阅读 · 0 评论 -
new-api - 新一代大模型网关与AI资产管理系统
AI模型接口管理与分发系统,支持将多种大模型转为OpenAI格式调用、支持Midjourney Proxy、Suno、Rerank,兼容易支付协议,可供个人或者企业内部管理与分发渠道使用,本项目基于One API二次开发。原创 2025-02-26 09:42:19 · 973 阅读 · 0 评论 -
one-api - 通过标准的 OpenAI API 格式访问所有的大模型
LLM API 管理 & 分发系统,支持 OpenAI、Azure、Anthropic Claude、Google Gemini、DeepSeek、字节豆包、ChatGLM、文心一言、讯飞星火、通义千问、360 智脑、腾讯混元等主流模型,统一 API 适配,可用于 key 管理与二次分发。单可执行文件,提供 Docker 镜像,一键部署,开箱即用。转载 2025-02-25 19:17:33 · 1018 阅读 · 0 评论 -
wdoc - 大量异构文档处理和总结
wdoc是一个功能强大的 RAG(检索增强生成)系统,旨在汇总、搜索和查询各种文件类型的文档。它对于处理大量不同的文档类型特别有用,非常适合处理大量信息源的研究人员、学生和专业人士。对所有其他用于查询或总结的 RAG 解决方案感到沮丧,因此将完美的解决方案放在一个包中。原创 2025-02-23 14:48:08 · 713 阅读 · 0 评论 -
ai-financial-agent - 为金融投资打造的AI代理
探索人工智能在投资研究中的应用。本项目仅用于**教育**目的,不用于真实交易或投资。原创 2025-02-21 17:12:30 · 1014 阅读 · 0 评论 -
Meetily - AI 驱动的会议助手
一个 AI 驱动的会议助手,可捕获实时会议音频、实时转录并生成摘要,同时确保用户隐私。非常适合希望专注于讨论,同时自动捕获和组织会议内容的团队,而无需外部服务器或复杂的基础设施。原创 2025-02-20 12:17:19 · 496 阅读 · 0 评论 -
FoloUp - AI 驱动的语音招聘面试官
FoloUp 是一个开源平台,供公司对候选人进行 AI 驱动的招聘面试。原创 2025-02-18 10:42:57 · 741 阅读 · 0 评论 -
CHRONOS - 新闻时间线摘要
CHRONOS是一种新颖的基于检索的时间线摘要 (TLS) 方法,通过迭代提出有关主题和检索到的文档的问题来生成按时间顺序排列的摘要。为开放域 TLS 构建了一个最新的数据集,它在大小和时间线持续时间方面都超过了现有的公共数据集。原创 2025-02-17 15:06:58 · 368 阅读 · 0 评论 -
pptx2md - 将PPT文件转换成Markdown
将 Powerpoint pptx 文件转换为 markdown 的工具。原创 2025-02-16 16:17:51 · 1179 阅读 · 0 评论 -
agent-service-toolkit - 轻量级的 AI 代理开发框架
帮助开发者用 Python 快速搭建和运行基于 LangGraph 框架的 AI 代理服务。它结合 FastAPI、Streamlit 和 Pydantic 等技术栈,提供了用户界面、自定义 Agent、流式传输等功能,并集成了内容审核(LlamaGuard)和用户反馈机制(LangSmith),极大地简化了 AI Agent 应用的开发和优化过程。原创 2025-02-12 09:27:13 · 1017 阅读 · 0 评论 -
open-webui - 用户友好的 AI 界面
功能强大、用户友好的自托管 AI 平台,支持完全离线运行。它集成了多种大型语言模型运行器,如 Ollama 和 OpenAI 兼容的 API,支持网页搜索、本地 RAG 集成、权限管理、适配移动端、Markdown 和 LaTeX 等功能。原创 2025-02-11 11:34:31 · 2096 阅读 · 0 评论 -
gptme - 终端中的个人 AI 助手
终端中的个人 AI 助手,带有工具,因此它可以:使用终端、运行代码、编辑文件、浏览 Web、使用视觉等等; 通过简单但功能强大的 CLI 协助各种知识工作,尤其是编程。原创 2025-02-08 11:05:38 · 862 阅读 · 0 评论 -
LivePortrait - 让肖像栩栩如生
视频驱动肖像动画框架,专注于更好的泛化性、可控性和实际使用的效率。为了提高生成质量和泛化能力,我们将训练数据扩展到约 6900 万个高质量帧,采用混合图像 - 视频训练策略,升级网络架构,并设计更好的运动变换和优化目标。原创 2025-02-06 10:49:20 · 717 阅读 · 0 评论 -
stocks-insights-ai-agent - AI驱动的股票分析工具
使用 Agentic Retrieval-Augmented Generation (RAG) 工作流程从与特定公司和更广泛的股票市场相关的新闻和财务数据中提取见解。它利用大型语言模型 (LLM)、ChromaDB 作为向量数据库、LangChain、LangChain 表达式语言 (LCEL) 和 LangGraph 来提供全面的分析。原创 2025-02-04 08:14:34 · 935 阅读 · 0 评论 -
AI-on-the-edge-device - 将“旧”设备接入智能世界
人工智能无处不在,从语音到图像识别。虽然大多数 AI 系统都依赖于强大的处理器或云计算,但**边缘计算**通过利用现代处理器的功能,使 AI 更接近最终用户。本项目演示了使用 **ESP32**(一种低成本、支持 AI 的设备)进行边缘计算,以数字化您的模拟电表,无论是水表、燃气表还是电表。通过经济实惠的硬件和简单的说明,您可以将任何标准仪表变成智能设备。原创 2025-02-02 11:18:14 · 1311 阅读 · 0 评论 -
minimind - 从零开始训练小型语言模型
大语言模型(LLM)领域,如 GPT、LLaMA、GLM 等,虽然它们效果惊艳, 但动辄10 Bilion庞大的模型参数个人设备显存远不够训练,甚至推理困难。 几乎所有人都不会只满足于用Lora等方案fine-tuing大模型学会一些新的指令, 这约等于在教牛顿玩21世纪的智能手机,然而,这远远脱离了学习物理本身的奥妙。 此外,卖课付费订阅的营销号漏洞百出的一知半解讲解AI的教程遍地, 让理解LLM的优质内容雪上加霜,严重阻碍了学习者。原创 2025-01-31 10:34:34 · 1856 阅读 · 0 评论 -
Lite.Ai.ToolKit - 一个轻量级的 C++ 工具包
🛠**Lite.Ai.ToolKit**:一个轻量级的 C++ 工具包,包含 100+ 个很棒的 AI 模型,例如对象检测、人脸检测、人脸识别、分割、遮罩等。请参阅 Model Zoo 和 ONNX Hub、MNN Hub、TNN Hub、NCNN Hub。原创 2025-01-27 11:55:19 · 859 阅读 · 0 评论 -
video-starter-kit - 浏览器中启用 AI 模型以进行视频制作
用于构建 AI 驱动的视频应用程序的强大入门套件。该工具包使用 Next.js、Remotion 和 fal.ai 构建,简化了在浏览器中使用 AI 视频模型的复杂性。原创 2025-01-26 10:38:52 · 645 阅读 · 0 评论 -
AstrBot - 多平台 LLM 聊天机器人及开发框架
AstrBot 是一个松耦合、异步、支持多消息平台部署、具有易用的插件系统和完善的大语言模型(LLM)接入功能的聊天机器人及开发框架。原创 2025-01-24 10:32:39 · 2570 阅读 · 0 评论 -
PaSa - 大型语言模型提供支持的高级论文搜索代理
一种由大型语言模型提供支持的高级 PaperSearch 代理。PaSa 可以自主做出一系列决策,包括调用搜索工具、阅读论文和选择相关参考文献,最终为复杂的学术查询获得全面准确的结果。原创 2025-01-23 16:21:31 · 1280 阅读 · 0 评论