- 博客(1155)
- 收藏
- 关注
原创 如何使用Ollama在本地运行Qwen3并支持MCP和工具使用?看完这篇你就懂了!!
Qwen3是阿里巴巴Qwen团队最新发布的开源大语言模型,提供具有竞争力的性能,高度模块化和工具使用能力。在本指南中,我将向您展示如何通过Ollama在本地运行Qwen3,并启用MCP(模型上下文协议)工具功能,如代码解释器、网络获取和时间查询。到最后,您可以构建由Qwen3驱动的智能助手,完全在您的机器上运行——无需云API密钥!
2025-07-05 08:00:00
572
原创 【AI大模型教程】LangGraph框架Agent RAG实战——CRAG,收藏这一篇就够了!!
为了提高RAG的性能,结合大模型的RAG技术涌现出很多的改进方案SELF-RAG,Adaptive RAG,CRAG等技术相继被提出,今天笔者就来介绍CRAG这个技术,并采用langchain全家桶中的LangGraph框架实现CRAG。看看CRAG比传统RAG强多少。
2025-07-04 11:41:19
323
原创 万字详解!一文带你搞明白AI大模型注意力机制!!零基础小白收藏这一篇就够了!!
Attention机制是深度学习中的一种技术,特别是在自然语言处理和计算机视觉领域中得到了广泛的应用。它的核心思想是模仿人类的注意力机制,即人类在处理信息时会集中注意力在某些关键部分上,而忽略其他不那么重要的信息。在机器学习模型中,这可以帮助模型更好地捕捉到输入数据中的关键信息。
2025-07-04 11:09:34
337
原创 给智能体更多“思考时间”:OPPO AI Agent团队如何系统性提升LLM Agent的性能
LLM Agent,这个概念大家可能已经不陌生了。它就像一个拥有超级大脑(LLM)的“数字员工”,能够自主规划、调用工具(如搜索引擎、计算器、代码执行器),一步步完成复杂的任务。从自动撰写市场分析报告,到预订一张复杂的联程机票,Agent展现了巨大的潜力。然而,理想很丰满,现实却有些骨感。尽管底层的大模型能力很强,但Agent在面对真正复杂的推理和规划任务时,仍然会像一个“新手员工”一样,频繁犯错:比如规划出错、工具调用失败、或者在某个步骤卡住无法前进。这背后的一大原因,是它们通常采用一种“线性”的思考
2025-07-03 17:56:49
550
原创 【AI大模型】RAG智能客服的召回率与精准率,评测到底在评啥?看完这一篇你就懂了!!
有人说:“你这客服系统效果咋样?召回率多少?精准率多少?” 我陷入沉思:这测试集得怎么构建呢,怎么能覆盖用户的所有提问……👇来聊聊:在 RAG 智能客服项目中,召回率和精准率到底能不能用,它们评测的是什么,我们又是如何“真正评估”系统效果的?
2025-07-03 17:36:03
404
原创 MCP 核心宝典 | 2025 最新最全!经典MCP案例实操讲解!学AI大模型的朋友必读!
为何要创造 MCP ?在MCP出现前,连接AI与外部数据和操作的方式要么是为每个工具硬编码逻辑,要么是管理不够稳健的提示链。
2025-07-02 14:07:57
430
原创 悟空Agent实战:LLaMA-Factory高危0day漏洞挖掘与修复
LLaMA-Factory是一个功能强大且用户友好的开源框架,在 GitHub 上斩获了超过 53K Stars,专注于大语言模型(LLM)的高效微调(Fine-tuning)。凭借其易用性和灵活性,LLaMA-Factory 已成为许多开发者和研究团队进行模型训练与部署的首选工具。
2025-07-02 11:34:33
857
原创 过去的提示词正在失效!这5种方法反而更好!!
有没有发现如今AI 越来越聪明,但我们却越来越难让它“听懂人话”。其实问题在于不是模型不行,而是你不会说“它的语言”。我们先盘点一下几个问题一、提示词工程“过时”了吗?首位「提示词指南」作者Sander 说:提示词不仅没过时,反而比以前更重要。
2025-07-01 14:43:36
834
原创 三核驱动!AI Agents+LLM+RAG:下一代分析平台架构全拆解
在数据驱动的时代,谁能第一时间看懂数据,谁就能掌握决策的主动权。但现实却是——你手握海量数据,却往往卡在一个SQL、一张报表,想做个可视化图表还得翻开Excel模板、对接技术同事,效率低得让人焦虑。有没有一种方式,只用一句自然语言,就能完成从“提问”到“图表”的全流程?今天我们就带你拆解一整套基于 AI Agents + 大模型 + 数据可视化平台 的智能分析架构,让你看清这套系统是如何让“数据自己说话”的。
2025-07-01 11:19:30
724
原创 别再只看文本了!EasyDoc 带你进入 RAG 全新时代!
在构建多模态检索增强生成(RAG)系统时,由于需要处理和理解多种类型的数据,我们面临着一系列独特的挑战。传统的 RAG 系统主要侧重于文本,但现实世界中的文档往往包含复杂的非结构化信息,比如表格、图表和图片。 这些非文本模态的数据给准确的信息提取和有效利用带来了显著的难题。
2025-06-30 21:00:28
578
原创 AI大模型如何“练成”?详解训练、微调与强化学习的基础逻辑
我们或多或少都听说LLM大模型是先“训练”出来,然后再用于“推理”,那怎么理解这个“训练”过程?是不是经常听说行业性场景中要使用垂域大模型,比通用大模型效果会更好,然后都说垂域大模型是“微调”出来的,那么什么是“微调”?和上面说的“训练”是什么关系?当你尝试去深入了解这些问题时,搜到的各种介绍是不是都有点深奥?看到预训练、后训练、监督微调、强化学习、低秩适应、奖励模型等一堆概念是不是有点懵逼?
2025-06-30 20:33:04
626
原创 AI大模型从入门到精通,通俗易懂的总结!RL for LLM本质理解
大型语言模型的演进,长期以来依赖于标准的监督学习(Supervised Learning)范式,主要体现在预训练(Pretrain)和指令微调(SFT)两个阶段。该范式的核心在于,模型需要依赖人类给出的、从输入到输出的完整监督信号进行学习。
2025-06-29 08:00:00
612
原创 万字解析!一文看懂注意力机制、通道注意力、空间注意力、自注意力,零基础小白必看!!
大家好呀,今天我们来分享注意力机制的概念和基本原理,并且进一步介绍通道注意力、空间注意力、混合注意力、自注意力等等,接下来我们就一起来看看吧1 注意力机制我们可以通过眼睛看到各种各样的事物,感知世界上的大量信息,可以让自己免受海量信息的干扰,是因为人的选择能力,可以选择重要的信息,而忽视不重要的信息。
2025-06-28 11:20:26
754
原创 合成数据>人工数据,绝对性能暴涨超10个点!仅需任务定义,高效微调大模型
基础模型严重依赖大规模、高质量人工标注数据来学习适应新任务、领域。为解决这一难题,来自北京大学、MIT等机构的研究者们提出了一种名为「合成数据强化学习」(Synthetic Data RL)的通用框架。该框架仅需用户提供一个简单的任务定义,即可全自动地生成高质量合成数据。结合自动强化学习(RL)微调的结果显示,该方法在数学、医疗,科学,金融等多个基准上取得十几个点的绝对性能提升。在同等数据数量条件下,其效果不仅显著优于人工数据下的监督微调方法,更媲美甚至超越了人工数据下的RL方法。
2025-06-28 10:26:17
916
原创 2025年,AI大模型在企业场景走到哪了?
企业部署 AI 不再是试验项目,而是战略行动。预算已经常态化、模型选择多元化、采购流程标准化、AI 应用开始系统落地。尽管产业需求和企业需求碎片化,但这正是企业拥抱的方向。一些关键厂商正在脱颖而出,企业也越来越多选择成品应用以加速落地。市场形态愈加接近传统软件,但变化节奏与复杂性却完全不同——这是 AI 的特有节奏。
2025-06-27 12:44:57
712
原创 知识增强大模型GraphRAG 如何彻底改变阿尔茨海默病的基因研究和治疗?看完这一篇你就懂了!!
随着阿尔茨海默病患者人数不断攀升,Cedars-Sinai医学中心通过知识图谱和AI技术,打造了AlzKB阿尔茨海默病知识库,用以推动新型病因和药物的发现。本文详解这些前沿工具如何结合,赋能专业人士实现高效科研转化,为认知障碍领域带来突破
2025-06-27 11:47:46
686
原创 大模型推理为什么又长又啰嗦?更多thinking≠更好结果,精准thinking可砍掉一半长度
大模型推理为什么又长又啰嗦?想象一下让学霸解题:明明第一步就得出答案,却非要反复验算十遍,还写满整张草稿纸——这就是当前大模型(如GPT-4、DeepSeek)的痛点!
2025-06-26 10:51:36
909
原创 六个安全Agent设计模式:有效防止Prompt注入攻击
Prompt注入是当前大模型安全领域中最令人头痛的挑战之一,尤其对于那些被设计用来与外部环境交互并执行任务的智能体而言。攻击者通过在输入中嵌入恶意指令,试图操纵智能体的行为,可能导致数据泄露、未经授权的操作,甚至服务中断。
2025-06-25 14:16:25
650
原创 Doc2X:为知识库RAG接上高精度文档解析的“智能引擎”
在数字化浪潮席卷各行业的今天,海量文档的智能处理与高效利用已成为开发者亟待解决的核心痛点。无论是构建智能知识库、优化信息检索,还是革新教育科技,精准、高效的文档解析能力都扮演着至关重要的角色。
2025-06-25 10:40:37
403
原创 如何把你的 DeePseek-R1 微调为某个领域的专家?看完这一篇你就懂了!
篇文章深入探讨了如何通过微调技术来优化大语言模型(如 DeepSeek)的表现,使其在特定领域或任务中更具优势。文章首先解释了微调的必要性及其在特定领域中的应用场景,并将微调与长文本处理、知识库的使用进行对比,帮助读者理解何时选择微调。接着,文章详细介绍了微调的基本流程,包括选择预训练模型、准备数据集、设置超参数等。通过硅基流动平台,读者可以体验在线微调的流程。最后,文章提供了一个使用 Colab 和 Unsloth 工具进行本地微调的实战指南,展示了如何从头到尾微调一个算命大师模型,并将其部署到本地环境中
2025-06-24 20:00:02
516
原创 腾讯一念LLM新版本发布:硬刚核心调度,满血版DeepSeek推理吞吐提升48%
DeepSeek-R1发布后,推理框架加速需求暴涨。在最近四个月中,各个开源框架(vLLM,SGLang,FlashInfer等)针对DeepSeek进行专项优化,性能提升了2-3倍。经过四个月的开发,一念发布了0.6.0,支持了DeepSeek模型和分布式推理。针对PCG业务的特殊需求,GPU资源供应灵活性要求高的特点,一念实现了流水线并行(PP)的multi-batch分布式推理方式。相对业界常见的多机DP+EP方案,跨机通讯量降低98.3%,机器之间通讯可以使用TCP,大大降低运营难度。然而即便使用T
2025-06-24 11:10:29
660
原创 【AI大模型】LLM不是所有!这几个模型你需要知道!
AI时代,远不止大语言模型一种,也不要企图通过大模型解决所有问题,复合AI系统已经成为共识,掌握各种模型的特点,对于构建高质量的AI应用十分关键,今天就带大家快速了解各类模型的特点。
2025-06-23 14:12:52
913
原创 AI 大模型应用落地到底选用单智能体架构还是多智能体架构?
最近关于 AI 大模型应用落地到底选用单智能体架构还是多智能体架构?业界争论很多,特别是 Anthropic 公司和 Devin 公司分别主张和使用了不同的智能体架构设计路线,Anthropic 公司认为多智能体架构才是 AI 大模型应用扩展性能的关键,而 Devin 公司认为:“Don’t Build Multi-Agents.”,并直接批评 OpenAI 和微软的开发框架 Sarm 和 AutoGen 方向搞错了。那么此刻要不要选用多智能体架构?我的观点是此刻并不需要,因为智能体架构发展阶段不同,参
2025-06-23 11:21:43
605
原创 使用 Transformers 为多语种语音识别任务微调 Whisper 模型,建议收藏!
本文提供了一个使用 Hugging Face 🤗 Transformers 在任意多语种语音识别 (ASR) 数据集上微调 Whisper 的分步指南。同时,我们还深入解释了 Whisper 模型、Common Voice 数据集以及微调等理论知识,并提供了数据准备和微调的相关代码。
2025-06-22 08:00:00
592
原创 普通人学习AI应该如何入手?2025年最新AI大模型学习路线+全套学习资料,适合新手小白!
随着人工智能(AI)技术的飞速发展,越来越多的人开始意识到掌握这项技能的重要性。然而,对于许多没有编程背景或数学基础的人来说,进入AI领域似乎是一个遥不可及的梦想。但实际上,通过合理的规划和适当的学习资源,任何人都可以逐步掌握AI的核心知识,并应用到实际工作中去。本文将为普通读者提供一份详细的2025年最新AI大模型学习路线图,并附带一套完整的从入门到精通的学习资料,帮助您从零基础起步,顺利开启AI学习之旅。
2025-06-21 11:21:07
747
原创 【大模型入门教程】5分搞懂大模型 - RAG(检索、增强、生成),收藏这一篇就可以了!!
RAG(Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research(FAIR)团队于2020年首次提出,并迅速成为大模型应用中的热门方案。
2025-06-21 10:55:21
736
原创 最新|用Qwen3 Embedding+Milvus,搭建最强企业知识库!!
这几天阿里低调放出两款 Qwen3 家族的新模型:Qwen3-Embedding 和 Qwen3-Reranker(都分别包括0.6B轻量版、4B平衡版、8B高性能版三种尺寸)。两款模型基于 Qwen3 基座训练,天然具备强大的多语言理解能力,支持119种语言,覆盖主流自然语言和编程语言。
2025-06-20 14:37:36
731
原创 RAG,在企业AI中释放LLM大模型的潜力
为了克服这些潜在问题,企业可以使用数据流将新信息导入其数据集,并部署检索增强生成(RAG),使大模型的响应更加准确,且与上下文相关。RAG通过与大模型微调(Fine Tune)技术、知识图谱等各种技术协同作用,正在彻底改变数据的处理、解释和使用方式,从而实现更准确、上下文感知和个性化的AI应用。这种超强组合,正在被OpenAI、微软、AWS、阿里云等应采用,领跑LLM的发展与应用。
2025-06-20 11:24:27
1036
原创 从硬件需求到软件配置,手把手教你本地部署Qwen 2.5-Coder大模型
Qwen 2.5-Coder 是基于 AI 的语言模型,也是先进的编程辅助工具,能帮助开发者自动化编码任务,还能在复杂编程挑战中提供智能辅助,提升开发效率和代码质量。本文教会大家如何在本地部署Qwen 2.5-Coder大模型。
2025-06-19 14:45:22
599
原创 RAG 开发四大痛点及解决方案,看到就是赚到!!
知识库缺乏必要的上下文信息,导致 RAG 系统在无法找到确切答案时,可能会提供模棱两可的错误信息,而不是直接表明其无知。这种情况下,用户可能会接收到误导性的信息,从而感到沮丧。
2025-06-19 14:42:58
832
原创 【AI大模型实战】Graph-RAG Agent:融合知识图谱与深度推理的下一代智能问答系统
graph-rag-agent聚焦于结合 GraphRAG 与 私域 Deep Search 的方式,实现可解释、可推理的智能问答系统,同时结合多 Agent 协作与知识图谱增强,构建完整的 RAG 智能交互解决方案。
2025-06-18 14:36:11
414
原创 AI大模型应用入门实战与进阶:构建你的第一个大模型:实战指南
AI大模型是指具有大量参数和复杂结构的人工智能模型。这些模型通常需要大量的计算资源和数据来进行训练,以实现高性能的预测和生成能力。近年来,随着计算能力的提高和数据量的增加,AI大模型在各种任务中取得了显著的成果,如自然语言处理、计算机视觉和强化学习等。
2025-06-18 11:18:05
894
原创 从0到1微调安全大模型,如何通过各种开源框架在本地完成安全大模型的微调?
本文将详细介绍如何通过各种开源框架在本地完成安全大模型的微调,从底层模型层来优化模型,做出适合安全研究人员的大模型微调简介微调,指的是在一个已经经过大规模、通用数据集预训练好的基础模型上,使用相对较小规模的、特定领域或特定任务的数据集,对该模型进行进一步训练的过程。
2025-06-17 19:29:51
993
原创 大模型唯一深度绑定的只有提示词,大模型所有的操作都是基于提示词进行的,其它任何操作都是建立在两者之上
“ 所有对大模型的操作都是通过提示词实现的,而其它所有功能都是基于此二者之上 。”大模型从训练完成之后其能力范围基本上就已经确定了,除非对模型进行重新训练或微调;但怎么用好大模型,激发大模型的潜力,那就要靠提示词来解决。大模型虽然功能强大,但其操作入口只有一个,那就是提示词,不论是RAG,AIGC,还是智能体都是通过提示词和大模型进行交互。
2025-06-17 11:27:58
703
原创 【AI大模型】一站式智能分析引擎,快速构建企业级数据分析Agent
在当今数据驱动的商业环境中,企业对数据分析的实时性、准确性与智能化提出了前所未有的高要求。然而,传统数据分析流程往往受限于离线处理机制、复杂的数据集成流程以及割裂的工具链,导致洞察滞后、效率低下,难以支撑快速决策与业务响应。
2025-06-16 11:11:10
570
原创 【AI大模型】GE-Chat:一种图增强的RAG框架,用于大模型的证据响应生成
大型语言模型现在是人类决策过程中的关键助手。然而,一个常见的附言似乎总是出现:“大型语言模型可能会犯错。对重要信息要格外小心。”这指出了大型语言模型并非所有输出都可靠,用户必须手动评估它们。随着幻觉响应的出现,常常伴随着看似合理的解释,使得问题变得更加复杂,并在用户中引发信任问题。为了解决这一问题,本文提出了GE-Chat,一种知识图增强的检索增强生成框架,以提供基于证据的响应生成。具体来说,当用户上传一份材料文档时,会创建一个知识图谱,这有助于构建一个检索增强的代理,用超出其训练语料库之外的额外知识来增强
2025-06-16 10:40:23
783
原创 DeepSeek+dify 本地知识库:高级应用Agent+工作流,收藏这一篇就够了!!
dify的强大在于其灵活性,主要体现在智能体和工作流上。它可以让一个没有编程能力的人通过简单学习,快速搭建Agent和自动化流程。就像拼积木一样。我们可以通过智能体或工作流,自定义工具完成很多我们好玩的功能。本文前面主要是介绍一些组件,有编程能力的同学建议直接跳过。
2025-06-15 08:00:00
978
原创 【喂饭教程】DeepSeek+Dify 构建本地知识库,真香!零基础小白建议收藏起来慢慢学!!
Dify 作为同样开源的 AI 应用开发平台,提供完整的私有化部署方案。通过将本地部署的 DeepSeek 服务无缝集成到 Dify 平台,企业可以在确保数据隐私的前提下,在本地服务器环境内构建功能强大的 AI 应用。
2025-06-14 08:00:00
1007
原创 AgentClinic:模拟临床医疗环境的多模态大模型智能体评估基准,建议收藏起来慢慢看!!
在临床场景中评估大型语言模型(LLM)对于评估其潜在的临床效用至关重要。现有的基准测试主要依赖于静态问答,这不能准确描述临床决策的复杂性和顺序性。在这里,我们介绍AgentClinic,一个用于评估模拟临床环境中LLM的多模态代理基准测试,其中包括患者互动、在不完整信息下进行的多模态数据收集,以及各种工具的使用,从而在九个医学专业和七种语言中进行深入评估。我们发现,在AgentClinic的顺序决策格式中解决MedQA问题要困难得多,导致诊断准确率可能降至原始准确率的十分之一以下。总体而言,我们观察到,来自
2025-06-13 11:06:23
974
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人