
AI应用
文章平均质量分 74
鱼满满记
这个作者很懒,什么都没留下…
展开
-
31.1K+ Star!Upscayl:一个免费开源的AI图像放大工具
Upscayl[1]是一个免费且开源的AI图像放大工具,支持Linux、MacOS和Windows操作系统。它使用先进的AI算法来放大和增强低分辨率的图片,而不损失质量,效果几乎像魔法一样!原创 2024-11-13 08:02:38 · 686 阅读 · 0 评论 -
35.3K+ Star!PhotoPrism:一款基于AI的开源照片管理工具
是一个为去中心化网络设计的AI照片应用,它利用最新技术自动标记和查找图片,实现自动图像分类与本地化部署,你可以在家中、私有服务器或云端运行它。原创 2024-11-12 07:58:43 · 2626 阅读 · 0 评论 -
35.3K+ Star!MockingBird:一个AI拟声工具, 5秒内克隆你的声音并生成任意语音内容
是一个AI拟声项目,能够在5秒内克隆你的声音并生成任意语音内容,实现实时语音合成。该项目支持中文普通话,并在多个数据集上进行了测试。原创 2024-11-10 17:30:07 · 1174 阅读 · 0 评论 -
31.7K+ Star!AgentGPT:一个在浏览器中运行的Agent
是一个可以让你在浏览器中组装、配置和部署自主AI代理的项目。你可以为你的自定义AI命名,并让它去实现任何你想象中目标。它将尝试通过思考要执行的任务、执行它们并从结果中学习来达成目标。原创 2024-11-08 08:16:57 · 894 阅读 · 0 评论 -
1.6K+ Star!Ichigo:一个开源的实时语音AI项目
Ichigo[1]是一个开放的、持续进行的研究项目,目标是将基于文本的大型语言模型(LLM)扩展,使其具备原生的“听力”能力。可以将其视为一个开放数据、开放权重、设备上的 Siri。该项目采用了早期融合技术,灵感来源于Meta的Chameleon论文。原创 2024-11-07 07:30:43 · 1613 阅读 · 0 评论 -
1.6K+ Star!GenAIScript:一个可自动化的GenAI脚本环境
是一个 JavaScript-ish 环境,提供了便捷的工具用于文件摄入、提示开发和结构化数据提取。它允许用户以编程方式组装大型语言模型(LLM)的提示,并通过单一脚本协调 LLM、工具和数据。原创 2024-11-06 07:28:45 · 1448 阅读 · 0 评论 -
11.6K+ Star!Plate:一个基于AI的富文本编辑器
Plate[1]是一个由 AI 驱动的富文本编辑器,为用户提供一个强大且易于使用的编辑体验。它支持多种功能,包括但不限于代码高亮、自动保存、协作编辑等,并且可以通过插件系统进行扩展,以满足不同用户的需求。原创 2024-11-03 16:22:14 · 1225 阅读 · 0 评论 -
18.9K+ Star!Frigate:一个基于Docker的NVR(网络视频录像机)系统
Frigate[1]是一个为IP摄像头设计的具有实时本地目标检测功能的网络视频录像机(NVR),支持视频流处理和物体检测。它专为Home Assistant[2]设计,并使用OpenCV和TensorFlow进行实时目标检测。原创 2024-11-01 07:36:06 · 3494 阅读 · 0 评论 -
1.2K+ Star!DocETL:一个强大的文档处理和ETL工具
DocETL[1]是一个用于创建和执行数据处理流水线的工具,特别适合复杂文档处理任务。它提供了一个低代码、声明式的YAML界面来定义基于LLM的操作,以处理复杂数据。适用于需要语义处理、复杂map-reduce任务、不确定如何表达任务以提高LLM准确性、处理长文档或需要验证标准的用户。原创 2024-10-30 08:09:18 · 436 阅读 · 0 评论 -
8.5K+ Star!Skyvern:一个基于LLMs和计算机视觉自动化浏览器工作流的工具
Skyvern[1]一个使用大型语言模型(LLMs)和计算机视觉自动化浏览器工作流程的工具。它通过API端点提供服务,能够在无需定制代码的情况下自动化多个网站上的手动工作流程。Skyvern利用计算机视觉和LLMs实时解析视口(viewport)中的项目,规划交互并执行操作。它具有适应网站布局变化、在未知网站上操作的能力,并能利用LLMs处理复杂交互情况。原创 2024-10-29 07:59:37 · 1761 阅读 · 0 评论 -
13.6K+ Star!Phidata:一个开源的AI智能体框架
Phidata[1]是一个用于构建具有记忆、知识、工具和推理能力的智能代理的框架。这些代理可以执行复杂的任务,如网络搜索、财务数据分析等,并且能够以团队的形式协同工作。Phidata 还提供了一个用户界面,允许用户与代理进行交互,以及监控和调试工具,以便开发者可以跟踪代理的性能并进行优化。原创 2024-10-25 08:25:18 · 1484 阅读 · 0 评论 -
13.4K+ Star!DeepFace:一个轻量级人脸识别和面部属性分析库
是一个用于 Python 的轻量级人脸识别和面部属性分析(年龄、性别、情绪和种族)库。DeepFace 利用深度学习进行人脸识别和分析,它通过封装多种先进的人脸识别模型,提供了一个简单易用的接口。用户无需深入了解背后的复杂过程,只需通过简单的函数调用来实现面部识别和属性分析。它是一个混合型人脸识别框架,集成了多种最新的模型,如 VGG-Face、FaceNet、OpenFace、DeepFace、DeepID、ArcFace、Dlib、SFace 和 GhostFaceNet。原创 2024-10-22 09:07:01 · 1019 阅读 · 0 评论 -
168K+ Star!AutoGPT:一个构建、部署和运行AI代理的强大平台
AutoGPT[1]是一个强大的平台,它允许用户创建、部署和管理持续运行的AI代理,以自动化复杂的工作流程。该项目的使命是提供工具,让用户能够专注于重要的事情。原创 2024-10-21 21:06:39 · 824 阅读 · 0 评论 -
8K+ Star!Screenpipe:一个AI屏幕与音频记录专家
是一个开源项目,它提供了24/7的本地AI屏幕和麦克风录制功能。它允许开发者构建具有完整上下文的AI应用程序。Screenpipe与Ollama兼容,是Rewind.ai的替代品。它强调开放性、安全性,并且用户拥有自己的数据。原创 2024-10-20 10:04:32 · 1210 阅读 · 0 评论 -
3.6K+ Star!AlphaCodium:一个创新的代码生成方法
是一个创新的代码生成方法,它通过一个基于测试的、多阶段的、以代码为中心的迭代流程,来提升大型语言模型(LLMs)在代码问题上的性能。与传统的自然语言处理任务不同,代码生成需要精确匹配目标语言的语法,识别最佳路径和边缘情况,关注问题规范中的众多细节,以及解决其他代码特有的问题和需求。原创 2024-10-19 18:32:51 · 1013 阅读 · 0 评论 -
5.3K+ Star!llmware:一个构建企业级RAG管道的统一框架
llmware[1]提供了一个统一的框架,用于构建基于大型语言模型(LLM)的应用,例如RAG(Retrieval-Augmented Generation)和多步骤代理工作流(Agent)。它使用小型、专门的模型,这些模型可以私有部署,安全地与企业知识源集成,并针对任何业务流程进行成本效益的调整和适应。原创 2024-10-18 08:19:50 · 1344 阅读 · 0 评论 -
69.5K+ Star!Whisper:一个开源的通用语音识别模型
Whisper[1]是一个由 OpenAI 开发的通用语音识别模型,它通过大规模弱监督学习训练而成。这个模型不仅能够进行多语言语音识别,还能进行语音翻译和语言识别,是一款多功能的语音处理工具。原创 2024-10-17 08:46:21 · 1049 阅读 · 0 评论 -
8.7K+ Star!Swarm:一个多智能体协同框架
Swarm[1]是一个由 OpenAI Solution 团队管理的实验性框架,用于探索多智能体系统的协同工作。它提供了一个轻量级、高度可控的平台,适合开发者学习和实验多智能体协同的模式。注:它目前处于实验阶段,不推荐在生产环境中使用,因此没有官方支持。原创 2024-10-15 22:57:56 · 322 阅读 · 0 评论 -
14.4K+ Star!GPT Researcher:一个基于AI的智能研究助手
是一个基于大型语言模型(LLM)的自动化智能体,目标是对任何给定主题进行在线全面研究。该智能体能够生成详细、事实和无偏见的研究报告,并提供定制化选项,以关注相关资源和大纲。GPT Researcher的设计灵感来源于最新的Plan-and-Solve和RAG论文,目标是解决错误信息、速度、确定性和可靠性问题,通过并行化智能体工作而不是同步操作,提供更稳定的性能和更快的速度。原创 2024-10-14 09:17:24 · 911 阅读 · 1 评论 -
1.5K+ Star!assistant-ui:一套构建AI聊天界面的组件库
是一套用于构建AI聊天界面的React组件库。它集成了多种模型提供商,如OpenAI、Anthropic、AWS、Google等,并支持自定义API集成。它旨在简化AI聊天界面的开发过程,使开发者能够快速构建出功能丰富的聊天应用。原创 2024-10-12 14:14:33 · 1325 阅读 · 0 评论 -
1.9K+ Star!gptme:你的终端个人AI助手
gptme[1]是一个运行在终端的个人AI助手,它配备了本地工具,可以编写代码、使用终端、浏览网页以及进行视觉识别。gptme旨在协助各种知识型工作,尤其是编程工作,通过一个简单但功能强大的命令行界面。原创 2024-10-11 08:33:23 · 567 阅读 · 0 评论 -
32.1K+ Star!LLaMA-Factory:一个大模型开发工具集
是一个用于高效微调100多种大型语言模型(LLMs)的统一平台,该项目在2024年的ACL会议上进行了展示。它支持多种模型和微调方法,包括全参数微调、局部冻结微调、LoRA和量化LoRA(QLoRA)等先进的算法和技术。原创 2024-10-10 08:16:20 · 672 阅读 · 0 评论 -
RD-Agent:一个基于AI的自动化研究与开发工具
是一个开源的R&D(研究与开发)自动化工具,通过人工智能技术推动数据驱动的AI研发过程。该项目专注于数据和模型这两个R&D的核心方面,以自动化高价值的通用R&D流程。原创 2024-09-27 23:46:36 · 1330 阅读 · 0 评论 -
2.7K+ Star!LlamaParse:一个为RAG和代理打造的文档解析神器
是一个专为生成式人工智能(GenAI)设计的文档解析器,能够解析复杂的文档数据,以适应任何下游大型语言模型(LLM)的使用场景,如检索增强生成(RAG)或智能代理。它能够解析多种复杂的文件类型,包括 PDF、PPTX、DOCX、XLSX 和 HTML,并且支持表格识别、多模态解析和自定义解析。原创 2024-09-26 22:12:18 · 800 阅读 · 0 评论 -
2K+ Star!Unstract:一个基于 LLM 的无代码智能文档处理平台
一个无代码平台,它利用大型语言模型(LLM)来自动化机器间的交互,通过简单的无代码方法,可以启动API和ETL(Extract, Transform, Load)管道,将非结构化文档转化为结构化的JSON数据。它不仅支持API的部署,还能从多种云文件或对象存储系统中读取复杂文档,并将结构化数据写入流行的数据仓库和数据库。原创 2024-09-25 22:05:53 · 1324 阅读 · 0 评论 -
12K+ Star!Taipy:一个快速将数据和AI算法转化为Web应用的工具
Taipy[1]是一个为数据科学家和机器学习工程师设计的,用于构建数据和AI Web应用的工具。它能够让用户无需学习新语言,只需使用Python,就能专注于数据和AI算法,而无需担心开发和部署的复杂性。它的核心优势在于简化了开发流程,使得用户可以专注于算法本身,而不是技术实现的细节。原创 2024-09-24 23:24:30 · 721 阅读 · 0 评论 -
7.2K+ Star!Follow:下一代信息浏览器
是一个集成了AI、区块链和社交功能的下一代信息浏览器,旨在为用户提供一个现代、快速、便捷的一站式信息中心。它支持多种平台,包括Windows、macOS、Linux、浏览器以及即将推出的Android和iOS移动版本。Follow利用AI技术提供个性化的信息服务,如翻译、总结、推荐和基于订阅的AI报告。此外,它还使用区块链技术激励活跃用户和优秀内容创作者,并通过社交功能允许用户分享订阅和发现新内容。原创 2024-09-13 23:02:01 · 3048 阅读 · 2 评论 -
2.7K+ Star!Crawl4AI:一个为大型语言模型(LLMs)和AI应用设计的网页爬虫和数据提取工具
是一个开源的、为大型语言模型(LLMs)和AI应用设计的网页爬虫和数据提取工具。它简化了网页爬取和数据提取的过程,使其更加易于访问和使用。原创 2024-09-13 22:57:09 · 2573 阅读 · 0 评论 -
55.4K+ Star!AppFlowy:一个基于AI的开源协作工作空间
一个结合了项目、wiki和团队的AI协作工作空间,它是一个开源的替代Notion的工具。AppFlowy的开发团队认为现有的协作工具存在局限性,如数据安全性和移动端兼容性问题。AppFlowy旨在打破这些限制,提供一个更加灵活、安全和易于使用的协作平台。原创 2024-09-16 09:28:16 · 1351 阅读 · 0 评论 -
28.5K+ Star!Langflow:一个用于构建 RAG 和多代理 AI 应用的低代码应用构建工具
一个用于构建 RAG(Retrieval-Augmented Generation)和多代理 AI 应用的低代码应用构建器。原创 2024-09-16 09:23:05 · 767 阅读 · 0 评论