
大模型 知识库
文章平均质量分 95
赤胜骄阳
存钱改运 独处养心 自律破局 读书聚气 感恩遇贵 博客作为
https://xiaolaifeng.gitee.io/
展开
-
Dify知识库 之二 SQL查询智能体
分析: 在 Docker 中运行的环境中遇到 ModuleNotFoundError: No module named ‘mysql’ 错误,通常是因为 Docker 容器中缺少所需的 Python 库。如果您使用 Dockerfile 构建镜像,请确保在 Dockerfile 中安装了 mysql-connector-python 库。实测postgresql和sqlite是ok的, mysql报错,其他几个未测试。3. 添加“执行”节点,命名为“执行查询”, 定义入参、处理函数、输出变量。原创 2025-04-01 09:16:52 · 929 阅读 · 0 评论 -
Mcp是个啥
Model Context Protocol (MCP) 是一个开放协议,它使 LLM 应用与外部数据源和工具之间的无缝集成成为可能。无论你是构建 AI 驱动的 IDE、改善 chat 交互,还是构建自定义的 AI 工作流,MCP 提供了一种标准化的方式,将 LLM 与它们所需的上下文连接起来。目前,MCP 已经积累了足够的临界规模和动能,因此它被视为 2023-2025 年“代理开放标准”之争的潜在赢家。寻找国内Claude Desktop平替, 实现mcp强大的ai扩展能力。原创 2025-03-31 10:13:00 · 569 阅读 · 0 评论 -
大语言模型引擎选型:vLLM、SGLang 、 Ollama
本文将带你深入了解 Transformers、vLLM、Llama.cpp、SGLang、MLX 和 Ollama 这些引擎,帮助你找到最适合的工具,释放大语言模型的全部潜力!特点:本地化部署工具,支持一键运行多种模型(如Llama、DeepSeek),集成Web界面。特点:基于C++的CPU推理引擎,专为资源受限环境设计,支持量化(4-bit/8-bit)。优势:吞吐量比vLLM高5倍,支持结构化输出(如JSON)和复杂控制流,适合企业级复杂任务。局限性:推理速度较慢,仅支持CPU,无法利用GPU加速。原创 2025-03-27 17:18:27 · 820 阅读 · 0 评论 -
ComfyUi教程之阿里的万象2.1视频模型
引用:2月25日晚间,阿里云旗下视觉生成基座模型万相2.1(Wan)正式开源,此次开源采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,同时支持文生视频和图生视频任务。原创 2025-03-27 13:38:03 · 1508 阅读 · 0 评论 -
数字人系统之HeyGem
头部数字人公司硅基智能宣布开源其核心产品「HeyGem.ai」,提供本地化部署的完整数字人解决方案。用户仅需1秒视频或照片,即可30秒生成高精度数字分身,支持无限克隆与离线使用,彻底打破行业技术壁垒。【开源推荐】Heygem AI: 开源的Heygen替代品(硅基智能)Github 地址:Heygem是一款专为Windows系统设计的全离线视频合成工具,它能够精确克隆您的外貌和声音,让您的形象数字化。您可以通过文字和语音驱动虚拟形象,进行视频制作。无需联网,保护隐私的同时,也能享受到便捷和高效的数字体验。原创 2025-03-18 15:53:27 · 820 阅读 · 0 评论 -
跟着Ai学Ai
今天使用traeAi帮我生成一个AI学习计划,不敢相信它居然强大如斯 以下是大纲, 博主会将9大详细学习计划分享给大家。原创 2025-03-18 13:48:02 · 430 阅读 · 0 评论 -
Flowith初体验
Flowith是一款创新的画布式 AI 平台,旨在提升效率和创意。它通过独特的画布交互、Oracle AI 系统、知识花园和丰富的模型选择,为用户提供全新的 AI 体验。画布交互打破线性思维,Oracle AI 帮助任务拆解与执行,知识花园构建知识图谱,多种 AI 模型满足不同需求。Flowith.io 适用于内容创作、学术研究、团队协作等多种场景。新手可享受免费试用和T-2模型免费使用。Flowith.io 代表了 AI 交互的新方向,值得探索。原创 2025-03-17 16:37:47 · 1688 阅读 · 0 评论 -
Dify知识库 本地部署DeepSeek 开启智能体和工作流
Dify是一个开源的 LLM 应用开发平台。提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用。比 LangChain 更易用。官网 https://dify.ai/zh。原创 2025-03-12 14:14:51 · 3779 阅读 · 0 评论 -
腾讯IMA知识库 大厂加入厮杀的战局
腾讯的IMA知识库(全称ima.copilot)是腾讯推出的以知识库为核心的AI智能工作台,集“搜、读、写”功能于一体,旨在提升用户学习与工作效率,并支持知识的长期沉淀与共享。ima.copilot 的 slogan 是“智慧因你而生”,其产品定位为“个人知识助理和效率工具”。从中可以看出,这款产品不仅仅是一个简单的内容存储工具,而是一个能够帮助用户在日常工作和学习中提升效率、结构化管理知识的智能助手。其背后采用腾讯的 混元大模型,依托丰富的数据源和用户个性化信息,实现了知识与洞察的深度结合。原创 2025-03-11 10:21:55 · 988 阅读 · 0 评论 -
AI智能体Manus 体验版
Manus是2025年3月由中国武汉(创始人华中科技大学毕业)团队Monica.im推出的全球首款通用型AI智能体(AGI Agent),其核心理念为“手脑并用”(Mens et Manus),旨在通过自主规划与执行任务,将用户需求转化为实际成果,而非仅提供建议。话说杭州、武汉,还有喊话的南京、抢人热火朝天的深圳。科技站从中美的国与国之间,到国内一线二线城市之间,战火又烧到啦教育界,凡人紧紧抓住飞速移动的列车,一不小心就甩出去。原创 2025-03-10 09:38:05 · 1049 阅读 · 0 评论 -
阿里最新qwq部署 体验吊打deepseek的小而美模型
QwQ-32B。朋友圈刚炸,凌晨工作群接着敲本着工作是老板的,粉丝是自己的第一性原则,先给大家分享下体验感受这个模型凭借其“娇小的身材”——32B 参数,即320亿,及其媲美大参数模型的性能——比如满血版,迅速走红。截至写这篇文章,Qwen 的官宣帖阅读数已超过170万。原创 2025-03-07 09:32:32 · 1202 阅读 · 0 评论 -
SparkAi系统体验
使用 Nodejs + NestJs 服务端渲染技术, 支持高并发(万级甚至千万级用户同时请求使用);提供更高的可用性和稳定性。系统平台支持:支持 电脑PC端+手机端H5+微信公众号对接(支持H5打包其他平台支持)支持宝塔常规部署和Decker一键部署方式,所有对接配置均可在后台界面上完成。支持OpenAI官方API + One API 等中转对接使用(即支持OpenAI全模型、三方大模型、国内全模型);原创 2025-03-06 10:13:00 · 1170 阅读 · 0 评论 -
自然语言转SQL之Vanna.ai:AI集成数据库
要实现的功能就是:用中文语言同数据库交流,而数据库给出的结果也是自然语言。原创 2025-03-04 18:05:32 · 1547 阅读 · 1 评论 -
KTransformers部署 使671B DeepSeek R1成「办公桌标配」
KTransformers作为一个开源框架,专门为优化大规模语言模型的推理过程而设计。它支持GPU/CPU异构计算,并针对MoE架构的稀疏性进行了特别优化,可以有效降低硬件要求,允许用户在有限的资源下运行像DeepSeek-R1这样庞大的模型。KTransformers实现了强大的CPU+DDR5+24GB显存环境下本地运行DeepSeek-R1满血版的能力,大大降低了部署成本和技术门槛。原创 2025-03-03 16:08:53 · 1776 阅读 · 0 评论 -
Page Assist插件访问本地部署DeepSeek
前言最近国产AI大模型Deepseek的爆火让大家都想尝试用一下来看看它到底有多好用,但是随着使用的人越来越多,大家也经常会发现提问时会得到服务器繁忙,请稍后再试的回复。其实我们完全可以在自己的Windows电脑上本地部署Deepseek大模型,并在浏览器中添加一个Page Assist插件来快速使用Web UI页面来与模型聊天,与之前介绍过的Open Web UI或Anything LLM相比,使用这款插件的使用门槛更低,新手也能立刻上手。原创 2025-02-27 14:51:30 · 1730 阅读 · 0 评论 -
Deepseek 手搓资源全集
deepseek资源大全原创 2025-02-25 09:48:05 · 782 阅读 · 0 评论 -
RagFlow+Ollama 构建RAG私有化知识库
官网RAGFlow是一个基于对文档深入理解的开源 RAG(检索增强生成)引擎。它的作用是可以让用户创建自有知识库,根据设定的参数对知识库中的文件进行切块处理,用户向大模型提问时,RAGFlow先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成答案输出。它能凭借引用知识库中各种复杂格式的数据为后盾,为用户提供真实可信,少幻觉的答案。RAGFlow的技术原理涵盖了文档理解、检索增强、生成模型、注意力机制等,特别强调了深度文档理解技术,能够从复杂格式的非结构化数据中提取关键信息。原创 2025-02-18 15:44:35 · 2090 阅读 · 0 评论 -
DeepSeek+即梦 做AI视频
DeepSeek 真的强,中美科技争霸赛终于杀到AI的针尖对麦芒阶段原创 2025-02-13 16:15:30 · 2353 阅读 · 0 评论 -
Llamaindex+Ollama 构建RAG私有化知识库
官网LlamaIndex是一个数据框架,它主要用于连接大型语言模型(LLMs)与外部数据源,例如API、PDF文档、SQL数据库等。这个框架的设计目的是为了增强LLM的能力,使其能够理解和生成更准确、更有上下文关联的文本,尤其是在涉及私人数据或特定领域知识的情况下。LlamaIndex通过创建索引结构来组织和访问数据,这样可以更高效地检索相关信息并将其提供给LLM。这些索引可以是列表索引、向量索引、树索引或关键词索引等,具体取决于数据类型和需求。原创 2025-02-12 13:42:02 · 1072 阅读 · 0 评论 -
清华大学:DeepSeek——从入门到精通2025
DeepSeek 是专注通用人工智能的中国科技公司,其开源的 DeepSeek - R1 推理模型性能出色,擅长处理复杂任务且可免费商用,在数学、代码、自然语言推理等方面与 OpenAI - o1 正式版相当,可应用于智能对话、文本生成等多种场景,并支持联网搜索与文件上传等功能。DeepSeek是中国一家专注于通用人工智能(AGI)研发的科技公司,其核心产品基于自主研发的大模型技术(如推理模型DeepSeek-R1和通用模型),在数学推理、代码生成、逻辑分析等复杂任务上性能比肩OpenAI顶级模型。原创 2025-02-11 15:47:21 · 1105 阅读 · 1 评论 -
Deepseek+Ollama 从入门到精通之本地部署deepseek
DeepSeek是中国一家专注通用人工智能(AGI)研发的科技公司,基于自主研发的大模型核心技术,提供智能对话助手(如深度求索)、开放平台API接口及企业级解决方案,涵盖智能客服、数据分析、内容生成等场景应用。性能对齐OpenAI-o1正式版DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。原创 2025-02-11 15:25:10 · 1273 阅读 · 0 评论 -
[开源]MaxKb+Ollama 构建RAG私有化知识库
MaxKb是一款基于 LLM 大语言模型的知识库问答系统。它允许用户构建自己的私人ChatGPT。与依赖云服务的AI工具不同,MaxKb支持本地开源和商用闭源的大语言模型(LLM),用户可以根据自己的需求和预算选择合适的模型。RAG检索增强生成(Retrieval-Augmented Generation,)是一种结合了信息检索和语言模型的技术,它通过从大规模的知识库中检索相关信息,并利用这些信息来指导语言模型生成更准确和深入的答案。本文主要是对基于MaxKB的知识库问答系统二次开发前的部署过程记录。原创 2025-02-10 17:14:56 · 1361 阅读 · 0 评论 -
2025年十大开源大模型RAG框架
检索增强生成(RAG)已成为增强大型语言模型能力的一项强大技术。RAG框架结合了基于检索系统的优点与生成模型的优势,能够提供更准确、更具上下文感知能力以及更及时的响应。随着对复杂AI解决方案的需求增长,许多开源的RAG框架在GitHub上涌现,每个框架都提供了独特的功能和能力。RAG框架的作用是什么?检索增强生成(RAG)是一种人工智能框架,通过整合外部知识源来增强大型语言模型(LLM)的能力。原创 2025-02-08 14:42:32 · 2473 阅读 · 0 评论 -
AnythingLLM+Ollama,基于RAG方案构专属私有知识库
官网https://anythingllm.com/AnythingLLM是一个AI聊天系统,它允许用户构建自己的私人ChatGPT。与依赖云服务的AI工具不同,AnythingLLM支持本地开源和商用闭源的大语言模型(LLM),用户可以根据自己的需求和预算选择合适的模型。和之前的大模型部署和应用过程相比,基于 AnythingLLM 的 RAG 实现整个部署过程比较繁琐,包括环境准备、Docker 安装和配置、AnythingLLM 配置等。原创 2025-01-16 13:31:28 · 2378 阅读 · 0 评论 -
Ollama+OpenWebUI+llama3本地部署
引言在4月19日刚刚发布,官方的对比结果中在开源模型中堪称世界第一,整好周六日有时间,在魔搭社区上测试一下。原创 2024-12-25 13:54:56 · 3349 阅读 · 0 评论