
AI
文章平均质量分 87
awei0916
这个作者很懒,什么都没留下…
展开
-
AI智能体结合知识库估算GPU算力的方案
在聊天模型中集成知识库(如RAG架构或微调嵌入),算力需求将因检索增强机制、上下文扩展及模型交互方式变化而显著增加。原创 2025-04-03 16:49:50 · 708 阅读 · 0 评论 -
Linux系统安装RabbitMQ
为了使用 Yum 存储库,必须在 /etc/yum.repos.d/ 目录下添加一个 .repo 文件(例如 rabbitmq.repo)。如果系统是Linux 7 可以将下面的el8 修改成 el7,将 el/8 修改成 el/7。在浏览器输入网址http://localhost:1567,使用admin登录。本文主要讲解Linux系统安装rabbitmq服务。说明:如果是Linux 7系统将el8修改成el7。原创 2025-03-30 14:00:00 · 287 阅读 · 0 评论 -
Dify外挂RAGFlow的知识库配置操作,实现提高增强检索能力
在AI应用开发领域,Dify凭借其革命性的可视化编排能力迅速成为低代码开发赛道的领跑者。然而随着企业级用户深入应用,其技术瓶颈逐渐显现:原生检索增强生成(RAG)引擎在处理多模态数据处理、长文本语义理解及高频迭代更新的企业级知识库时,响应质量与效率呈现显著衰减,尤其在应对复杂业务场景下的多轮对话意图捕捉、跨文档关联推理等核心需求时,现有架构暴露出明显的性能天花板。作为开源领域新一代检索增强生成引擎,RAGFlow通过深度文档理解技术重构了多模态数据处理范式。原创 2025-03-28 18:55:25 · 1989 阅读 · 0 评论 -
AI人脸识别技术接入方案对比
阿里云视觉智能开放平台基于达摩院自研的人脸人体分析技术,提供人脸检测与五官定位、人脸属性识别、人脸比对、人脸搜索、人体检测、人体属性、行为分析等多种功能,为开发者和企业用户提供高性能高可用的人脸人体识别服务。服务端人脸识别离线SDK,包括人脸检测、人脸跟踪、人脸关键点定位、人脸质量、角度模型、活体检测和人脸识别等能力,可以直接部署服务器上。最近公司做人脸识别相关的项目,考虑到识别结果的准确率和成本的问题,调研了百度,阿里云,科大迅飞,微信小程序相关的人脸识别接口接入方式以及收费情况。原创 2025-03-26 17:23:53 · 660 阅读 · 0 评论 -
DeepSeekR1与DeepSeekV3区别
其中,R1 版本是专门针对复杂逻辑推理场景优化的模型,通过强化符号逻辑处理能力,擅长解决数学证明、代码生成、逻辑问答等需要深度推理的任务。而 V3 版本则定位为通用型自然语言处理平台,在保持基础语言理解能力的同时,重点提升了多模态内容处理(如图文理解、视频解析)和超长文本建模(支持 10 万 token 以上上下文)的能力,更适用于知识图谱构建、跨模态检索、长文档摘要等综合型应用场景。,在数学、逻辑和复杂问题解决上表现卓越,适合需要深度思考的场景。,在编程、多语言和内容生成上领先,适合企业级通用需求。原创 2025-03-26 09:11:19 · 987 阅读 · 0 评论 -
大模型部署主流工具对比:Ollama,vLLM,llama.cpp,LM Studio
LM Studio是一款功能强大的桌面应用程序,旨在让用户能够在本地设备上轻松运行、管理和部署大型语言模型(LLMs),而无需依赖昂贵的云端服务。它降低了使用大语言模型的门槛,提供了离线运行、灵活使用模型和广泛模型兼容性等核心功能,特别适合开发者和爱好者使用。Ollama是一个开源的本地运行和管理大语言模型(LLM)的工具,旨在帮助用户快速在本地设备上部署和管理大模型,如Llama 2和DeepSeek。多模型格式支持增加了模型选择的灵活性,用户可以使用不同类型的模型。原创 2025-03-25 16:22:40 · 1268 阅读 · 0 评论 -
使用DeepSeekR1基于LangChain构建聊天机器人(带记忆功能)
基于任何LLM框架构建的链和智能代理,并与LangChain无缝集成,LangChain是使用LLM构建的首选开源框架。简单说就是用它来观察大模型进行了哪些调用,让你清楚你的大模型内部咋工作的。为了让大家先感受一下LangChain框架,这里使用框架进行一个最简单的对话案例,注意,这个案例一定是正确的,如果报错则一定是环境缺少包或者环境变量没配置等问题。LangChain应用需要一个大模型型,官方教程使用的是OpenAI,本文使用硅基流动的DeepSeekR1满血版进行演示。”就无法把问题回答准确。原创 2025-03-24 18:10:23 · 1492 阅读 · 0 评论 -
大模型AI应用系统Dify,RAGFlow,MaxKB,FastGPT,OpenWebUI详细对比
企业知识管理:MaxKB(知识图谱 + 权限管理)或 FastGPT(轻量级 RAG 构建)。深度文档问答:RAGFlow(灵活检索逻辑)。AI 应用开发:Dify(全流程开发)或 FastGPT(RAG 流程编排)。模型部署与测试:OpenWebUI(本地即开即用)。原创 2025-03-20 15:24:49 · 1732 阅读 · 0 评论 -
从能力释放到生态重构:Model Context Protocol 的技术跃迁
正如USB-C为设备连接各类外设配件提供了标准化连接方式,MCP则为AI模型连接不同数据源和工具建立了统一标准。MCP由Anthropic公司提出并开源,其核心架构包括MCP服务器和MCP客户端。MCP服务器负责暴露数据,而MCP客户端则负责访问这些数据,从而实现大模型与外部数据源的无缝集成。MCP 的核心遵循客户端-服务器架构,其中主机应用程序可以连接到多个服务器。:MCP 服务器可以连接到的互联网(例如,通过 API)提供的外部系统。越来越多的预构建集成,您的大语言模型可以直接接入。原创 2025-03-18 19:20:54 · 994 阅读 · 0 评论