- 博客(832)
- 收藏
- 关注
原创 一文读懂大模型生态系统:AGI、Prompt、RAG、Agent、...
每次与AI圈内人士聊天,总会听到这些术语:“AGI、Prompt、RAG、Agent、...”。你听说过这些术语,却不一定搞懂它们到底是什么,它们之间又有什么关系?今天,我们就用最通俗的语言,帮你理清这些概念,看懂大模型智能生态系统的全貌。
2025-04-01 11:27:36
652
原创 【AI大模型】基于RAG的MaxKB知识库问答系统如何选择向量模型,零基础小白收藏这一篇就够了!!!
在MaxKB中替换向量模型前,我们需要先了解向量相关的原理和技术,此处不做赘述,大家可以自行学习。可以了解下Embedding、Embedding核心,向量库等内容。
2025-04-01 10:52:45
320
原创 LangChain进阶指南,RAG实践总结,建议收藏起来慢慢看!!
当下领先的大语言模型(LLMs)通过大规模数据训练来掌握广泛的普遍知识,这些知识存储在其神经网络的权重中。然而,如果要求LLM生成涉及其训练数据以外的知识(如最新、专有或特定领域信息),就会出现事实上的错误(称为"幻觉")。
2025-03-31 21:51:36
292
原创 全面指南!掰细了讲Transformer模型各个组件和数据流动过程,零基础小白收藏这一篇就够了!!
最近 Transformer 模型可太火了,它作为 GPT 中的 “T”,无疑是当下人工智能领域的核心技术,甚至堪称 21 世纪最伟大发明的有力候选者。你是不是也常听到它的大名,却对其原理一知半解?本文是一篇关于Transformer模型的详细解析,作者通过实际操作和代码追踪,深入探讨了Transformer模型的工作原理,特别是其在训练和文本生成中的具体机制。
2025-03-31 21:20:27
600
原创 Deepseek本地部署详细指南!从 Ollama 到个人知识库应用
为了帮助更多热爱技术、渴望成长的朋友,我特别整理了一份涵盖大模型领域的宝贵资料集。这些资料不仅是我多年积累的心血结晶,也是我在行业一线实战经验的总结。这些学习资料不仅深入浅出,而且非常实用,让大家系统而高效地掌握AI大模型的各个知识点。如果你愿意花时间沉下心来学习,相信它们一定能为你提供实质性的帮助。这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费。
2025-03-30 08:00:00
930
原创 AI大模型基础:基本概念、Prompt、RAG、Agent及多模态,零基础小白收藏这一篇就够了!!
随着大模型的迅猛发展,LLM 作为人工智能的核心力量,正以前所未有的方式重塑着我们的生活、学习和工作。无论是智能语音助手、自动驾驶汽车,还是智能决策系统,大模型都是幕后英雄,让这些看似不可思议的事情变为可能。
2025-03-29 15:21:52
688
原创 喂饭级别教程,从零开始学习Transformer模型的原理,收藏这一篇就够了!!
在过去几年中,我们在构建智能机器的数十年追求中取得了巨大的进步:即大型语言模型(LLM)的诞生。这一技术基于试图模拟人类大脑的研究,开创了一个名为生成式人工智能的新领域——这种软件能够以接近人类能力的水平,生成可信且复杂的文本、图像和计算机代码。
2025-03-29 13:59:23
580
原创 2025 人工智能最前沿:分享几个大模型(LLMs)的热门研究方向
在人工智能领域,大模型的研究正迅速发展,当前涵盖了很多个研究方向,每个方向都带有其独特的研究重点和挑战。下面给大家盘点几个比较热门的研究方向,主要包括检索增增强生成RAG、大模型Agent、Mamba、MoE、LoRA等,这些些研究方向旨在解决大模型在实际应用中的关键问题,提高性能和实用性。希望给正在找研究方向的小伙伴一些启发。
2025-03-28 11:43:53
871
原创 我也曾一上来就想微调大模型,直到我发现自己错得离谱!
假如你在大学备战期末考试,整整一个学期,你苦读教材,核心知识早已烂熟于心,考试时根本不用翻书。但突然,有人问你一个课本没讲的新问题,你有点懵,赶紧抓起手机查百度,找到答案后自信回答。这两种场景,正好对应了我们提升大型语言模型(LLM)准确性的两大“神器
2025-03-28 11:31:55
610
原创 35岁大龄程序员现在学AI大模型完全没问题,甚至可能比年轻人更有优势!!
35岁,还想学习AI?你一定不是一个人。人工智能(AI)迅速崛起,已经成为现代社会和未来发展的重要推动力。不论是在工作中提升效率,还是在创业中找到新机会,掌握AI技能都可能带来巨大的优势。那么,35岁的你能否学懂、用好AI呢?答案是肯定的!本文将为你提供一条清晰的学习路径,帮助你从零开始进入AI的世界。
2025-03-27 15:14:30
282
原创 AI Agents入门教程之不同类型的智能体,看到就是赚到!!!
在本文中,我们将探讨不同类型的AI Agent,介绍其实现方式、现实应用场景、优势与局限性。从简单的反射型智能体到复杂多智能体系统,我们将解析这些模型如何驱动自动化进程、赋能决策制定并实现智能问题解决。通过深入探讨,我们将了解这些技术如何支撑现代自动化体系、优化决策流程,以及通过智能协作攻克复杂挑战的运行机制。
2025-03-27 11:25:32
996
原创 为什么大语言模型会产生幻觉?如何解决大语言模型幻觉问题?看完这一篇你就懂了!!
随着ChatGPT 的兴起,大语言模型再次被提及,越来越多的行业开始探索,如导购、政府、教育、医疗等行业;大语言模型的突破,展现出了类人的通用智能“涌现”能力,能够学习多个领域的知识、处理多种任务,因此被称为通用大模型,通用大语言模型具备特点也具备不足,大模型特点主要参数模型大、泛化能力强、支持多模态,如 GPT、豆包、通义等在语言交互场景回答问题表现出色。虽然大语言模型在多个指标展现的能力可能超出人类,但大语言模型也存在诸多不足:
2025-03-26 11:46:23
796
原创 【AI大模型】一文了解思维链(Chain-of-Thought, CoT),零基础小白收藏这一篇就够了!!
思维链(Chain-of-Thought, CoT)是一种通过引导大型语言模型生成中间推理步骤来提升复杂任务表现的提示方法。其核心思想是在少样本学习(few-shot learning)中,通过展示从输入到输出的完整推理路径,而非仅提供最终答案,从而激活模型的逻辑推理能力。少样本学习是指在训练数据有限的情况下,模型能够快速适应新任务并进行有效学习的一种学习方式,在思维链中,通过这种方式让模型理解并生成推理过程,进而提高其在复杂任务中的表现。
2025-03-26 10:52:34
508
原创 AI赋能运维:AI Agent在运维场景中的应用,看完这一篇你就知道了!!!
随着人工智能技术的飞速发展,AI Agent在运维领域的应用日益广泛。本文将详细探讨单Agent和多Agent在运维中的具体应用场景,以及它们如何提升运维效率和质量。
2025-03-25 14:35:03
706
原创 万字长文!从AI Agent到Agent工作流,一文详细了解代理工作流(Agentic Workflows)
AI Agent、Agentic AI、Agent架构和Agent工作流等概念如今备受关注,但它们究竟是什么?它们能做什么?新技术常常伴随着混乱的术语和炒作。本文将深入解析代理型AI的关键概念——代理工作流(Agentic Workflows)。
2025-03-25 11:49:27
688
原创 互联网医疗用户规模3.65亿人,企业积极布局医疗健康AI大模型
近日,中国互联网络信息中心发布《第54次中国互联网络发展状况统计报告》,核心数据指出: 截至2024年6月,我国网民规模近11亿人(10.9967亿人),较2023年12月增长742万人;互联网普及率达78.0%,较2023年12月提升0.5个百分点。截至2024年6月,我国农村网民规模达3.04亿人,占网民整体的27.7%;城镇网民规模达7.95亿人,占网民整体的72.3%。
2025-03-24 14:08:25
256
原创 LLM每周速递!学术最前沿:Agent应用、强化学习、RAG、复杂推理、多模态等
紧跟技术发展趋势,快速了解大模型最新动态。今天继续总结最近一周的研究动态,本片文章共计梳理了10篇有关大模型(LLMs)的最新研究进展,其中主要包括:多尺度注意力(Attention)、强化学习算DAPO算法、大模型多Agent系统、人形机器人、调研报告生成、多模型推理模型、长CoT推理模型、RAG系统能力提升应等热门研究。
2025-03-24 10:57:47
907
原创 详细!离线部署大模型:ollama+deepseek+open-webui安装使用方法及常见问题解决
ollama 是一个开源的本地大语言模型运行框架,它提供了非常简单便捷的使用形式,让用户可以十分方便的在本地机器上部署和运行大型语言模型,从而实现免费离线的方式使用 LLM 能力,并确保私有数据的隐私和安全性。
2025-03-23 08:00:00
1259
原创 一文搞懂DeepSeek - 基于R1蒸馏Qwen1.5B,建议收藏!!
知识蒸馏是一种将复杂的大型模型(教师模型)的知识迁移到较小的模型(学生模型)中的技术。在这个过程中,教师模型的推理能力和知识被提炼并转移到学生模型中,从而使学生模型能够在保持较高性能的同时,具有更低的计算复杂度和资源消耗。
2025-03-22 11:42:08
853
原创 从理论到实践:RAG、Agent、微调等6种常见的大模型定制策略,收藏这一篇就够了!!
大语言模型(LLM)是基于自监督学习预训练的深度学习模型,训练数据量庞大、训练时间长,并且包含大量的参数。LLM在过去两年中彻底改变了自然语言处理领域,展现了在理解和生成类人文本方面的卓越能力。
2025-03-22 10:55:10
665
原创 AI Agent:7个国内框架 & Agent应用,看到就是赚到!!
AI Agent 技术成为备受瞩目的焦点,其强大的功能和广泛的应用前景正在深刻改变我们的工作和生活方式。作为一种智能实体,AI Agent 具备自主感知环境、决策行动的能力,如同个人或组织的数字化替身,能有效简化工作流程、降低人力投入和沟通障碍,极大地提升效率与协作水平。本文将深入探讨 AI Agent 的核心机制、各平台功能特点、主流一站式 Agent 平台、框架总结以及其在多个领域的应用,为读者全面呈现这一前沿技术的全貌。
2025-03-21 11:38:38
618
原创 最新「大模型简史」整理!从Transformer(2017)到DeepSeek-R1(2025)
2025年初,国内推出了一款开创性且高性价比的「大型语言模型」(Large Language Model, LLM) — — DeepSeek-R1,引发了AI领域的巨大变革。本文回顾LLM的发展历程,以2017年具有革命性意义的Transformer架构为起点。
2025-03-21 10:47:30
721
原创 【AI大模型】向量数据库+上下文检索:提升RAG等AI应用的精准性与效率,建议收藏起来慢慢看!!!
随着 生成式 AI(GenAI)的兴起,向量数据库(Vector Database)迅速走红。然而,向量数据库的应用远不止于大模型(LLM),它同样适用于各种 AI 系统,尤其是在 RAG 的场景下。在 AI 领域,我们经常处理向量嵌入(Vector Embeddings)。向量数据库正是为了高效存储、更新和检索这些嵌入数据而生的:
2025-03-20 14:32:48
491
原创 2025年的风口!| 万字长文,带你纵观大模型Agent,涉及研究痛点、应用场景、发展方向
去年曾发文说大模型Agent是2024年的发力点,现在随着基模能力越来越强,今年的AI Agent仍将是热门话题,而且一些最新学术研究都与Agent相关。作为今年特别重要的一个风口,躺在风口上也能稍你一程。那么什么是Agent呢,可能每个人对Agent的理解都不一样。今天给大家重新梳理一下Agent的知识,其中主要包括Agent组成、各部分面临痛点、应用场景、未来发展、以及相关开源框架等,其中穿插了一些个人思考,有错误地方还请批评指正。
2025-03-20 11:04:44
586
原创 手把手教你使用ollama完成DeepSeek本地部署,适合零基础小白,建议收藏!!
ollama是一个开源的 LLM(大型语言模型)服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛,使得大模型的开发者、研究人员和爱好者能够在本地环境快速实验、管理和部署最新大语言模型。
2025-03-19 11:31:13
790
原创 RAG 范式、技术和趋势,从入门到精通,零基础小白看完这一篇就够了!!
随着RAG技术的进一步发展和进化,产生了模块化RAG的概念。在结构上,它更自由、更灵活,引入了更具体的功能模块,如查询搜索引擎和多个答案的融合。在技术上,它将检索与微调、强化学习和其他技术相结合。在流程方面,RAG模块经过设计和编排,形成了各种RAG模式。
2025-03-19 10:27:36
929
原创 医护人员DeepSeek的实用操作指南,建议收藏!!!
2025年伊始,DeepSeek凭借其强大的推理能力、实时动态分析及高效交互体验,迅速成为医疗领域的焦点。然而,90%以上的医护人员尚未深入了解这一工具的潜力,仅将其视作简单的问答助手。事实上,DeepSeek能够为临床决策、科研探索、患者管理等多个方面提供高效支持。本文将解读DeepSeek的功能特点、使用策略以及在医疗场景中的具体应用等内容,帮助医护人员快速掌握这一工具,提升工作效率。
2025-03-18 11:29:01
443
原创 Dify知识库分段与数据清洗实战:优化LLM检索效率与回答精准性指南
将内容上传至知识库后,要对内容进行分段与数据清洗。该阶段是内容的预处理与数据结构化过程,长文本将会被划分为多个内容分段
2025-03-18 11:04:44
1402
原创 DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(LLM)的推理能力。这项研究在如何仅依靠强化学习而不是过分依赖监督式微调的情况下,增强LLM解决复杂问题的能力上,取得了重要进展
2025-03-17 14:02:21
661
原创 LLM、Prompt、AI Agent、RAG... 一网打尽大模型热门概念究竟什么是大模型?
随着 ChatGPT、DeepSeek 等大语言模型的迅速崛起,AI技术已深度融入我们的日常生活与工作场景。对于程序员群体而言,大语言模型在代码生成领域的效率提升尤为显著,拥抱AI技术已成为必然趋势。那么,究竟什么是大模型?频繁出现的Prompt、RAG、Agent等专业术语又该如何理解?本文将针对大模型及其相关概念进行入门级的介绍,旨在于建立对大模型的基础认知与理解。
2025-03-17 11:16:56
714
原创 通义千问1.5(Qwen1.5)大语言模型在PAI-QuickStart的微调与部署实践
Qwen1.5(通义千问1.5)是阿里云最近推出的开源大型语言模型系列。作为“通义千问”1.0系列的进阶版,该模型推出了多个规模,从0.5B到72B,满足不同的计算需求。此外,该系列模型还包括了Base和Chat等多个版本的开源模型,为全球的开发者社区提供了空前的便捷性。阿里云的人工智能平台PAI,作为一站式的机器学习和深度学习平台,对Qwen1.5模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过PAI-QuickStart轻松实现Qwen1.5系列模型的微调和快速部署。
2025-03-16 08:00:00
583
原创 【AI大模型实战】llm-action:让天下没有难学的大模型
近年来,随着Transformer、MOE架构的提出,使得深度学习模型轻松突破上万亿规模参数,传统的单机单卡模式已经无法满足超大模型进行训练的要求。因此,我们需要基于单机多卡、甚至是多机多卡进行分布式大模型的训练。而利用AI集群,使深度学习算法更好地从大量数据中高效地训练出性能优良的大模型是分布式机器学习的首要目标。为了实现该目标,一般需要根据硬件资源与数据/模型规模的匹配情况,考虑对计算任务、训练数据和模型进行划分,从而进行分布式训练。因此,分布式训练相关技术值得我们进行深入分析其背后的机理。
2025-03-15 08:00:00
1014
原创 深度 | 构建个人的人工智能体(AI Agent),你应该了解的那些事
现在各大科技公司正在投入巨额资金来创建人工智能体(AI Agent),他们的研究工作可能会带给我们几十年以来一直追寻的那种实用且可以自由互动的人工智能。包括Sam Altman在内的许多专家都表示,AI Agent 已成为下一个大热门方向。
2025-03-14 13:50:46
1068
原创 用于图像分割的协 SMA Transformer:同多注意力转换器 !
在医学图像分割中,基于注意力机制和卷积神经网络的Transformer在提高性能方面起到了重要作用。然而,早期的模型往往在分割小而形状不规则的肿瘤时表现不佳。为此,作者提出了一种基于SMA架构(Synergistic Multi-Attention)的高效Transformer模型,用于增强小肿瘤和器官的分割效果。
2025-03-14 10:39:54
394
原创 利用ollama + RAGFlow部署千问大模型构建个人知识库AI智能体应用,零基础小白收藏这一篇就够了!
将开源的大语言预训练模型部署到用户设备上进行推理应用,特别是结合用户专业领域知识库构建AI应用,让AI在回答时更具有专业性,目前已经有很多成熟的应用方案。其中,支持大模型本地化部署的平台及工具很多,比较出名的有ollama、vLLM、LangChain、Ray Serve等,大大简化了模型的部署工作,并提供模型全生命周期管理。对应地,需要知识库构建的相应工具,能处理各种格式(doc/pdf/txt/xls等)的各种文档,能够直接读取文档并处理大量信息资源,包括文档上传、自动抓取在线文档,然后进行文本的自动分
2025-03-13 15:24:35
871
原创 本地知识库+本地大模型,借助RAGFlow搭建医院医疗问诊助手,纯本地,超实用!
RAGFlow是一个基于对文档深入理解的开源 RAG(检索增强生成)引擎。它的作用是可以让用户创建自有知识库,根据设定的参数对知识库中的文件进行切块处理,用户向大模型提问时,RAGFlow先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成答案输出
2025-03-13 13:56:10
829
原创 【AI大模型】什么是AI幻觉,为什么大语言模型会胡编乱造(及如何解决)
AI “幻觉”指的是大语言模型(LLM)在缺乏真实依据的情况下生成不准确、误导性甚至完全虚构的内容。其幻觉现象源于模型架构的局限性以及基于概率的生成方式的限制。尽管它们目前无法被完全消除,但理解幻觉产生的原因为有效的缓解提供了基础。本篇文章来自 Emil Sorensen(kapa.ai 创始人&CEO)的最新博客,他在文章中重点探讨了 AI 幻觉产生的原因、减少幻觉的技术策略,以及最新的研究进展。
2025-03-12 19:20:26
990
原创 从“人工智障”到“真智能”:AI智能体如何突破最后一道技术壁垒?
在人工智能领域,检索增强生成(RAG)系统因其从海量数据中提取相关信息并生成智能回答的能力而备受瞩目。然而,AI智能体(AI Agents)却将这一能力推向了全新的高度。它们不仅仅是获取和加工数据的工具,而是能够自主思考、规划并采取行动的智能系统。想象一下,您有一个助手,不仅能帮您整理文件,还能判断如何处理它们、安排后续步骤,并在情况变化时灵活调整策略——这就是AI智能体所承诺的未来。
2025-03-12 11:45:19
612
原创 【前沿技术】企业本地部署大型语言模型(LLMs)构建本地垂直领域知识库的策略
在数字化转型的浪潮中,传统企业面临着前所未有的机遇与挑战。随着大数据、云计算和人工智能技术的发展,企业积累的私有数据成为了潜在的金矿,等待着被挖掘和利用。大型语言模型(LLMs)作为当前人工智能领域的前沿技术,能够帮助企业从海量数据中提取有价值的信息,优化决策流程,提升服务质量。
2025-03-11 11:38:41
1003
原创 一文搞懂大模型训练加速框架DeepSpeed的使用!建议零基础小白人手一份!!
在AI领域,常见的深度学习框架TensorFlow、PyTorch和Keras无疑是开发者们的得力工具,但随着模型规模的急剧膨胀,这些传统框架在应对大模型时往往会显得力不从心。
2025-03-11 10:49:44
989
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人