- 博客(1069)
- 收藏
- 关注
原创 大模型岗面试题及答案,程序员必学!大模型入门基础知识详解(建议收藏)
本文系统介绍大语言模型基础知识,涵盖定义、主流开源体系(LLaMA、GPT、GLM等)、Decoder架构区别、训练目标、涌现能力原理、参数量含义及优缺点,为小白和程序员提供全面的大模型入门指南。
2025-11-24 19:53:31
267
原创 值得收藏!一文读懂大模型、智能体、AIGC:小白到高手的AI进阶指南
本文详解了大模型、智能体和AIGC三大AI技术的核心概念与应用场景。大模型作为AI"智慧大脑"处理海量数据;智能体作为"执行者"感知环境并执行任务;AIGC作为"创作者"自动生成数字内容。这些技术正革命性提升工作效率,推动生活场景智能化,并重构行业生态。文章建议读者体系化构建AI能力,通过实战积累经验,动态追踪行业趋势,从而抓住AI技术浪潮带来的机遇。
2025-11-24 19:44:32
452
原创 【必看收藏】LangChain 1.0 Agent中间件深度解析:从入门到精通的实用指南
本文详细解析LangChain 1.0 Agent框架的中间件机制,这是一种可插拔扩展系统,允许在模型调用、工具执行等关键点插入自定义逻辑。文章涵盖中间件工作原理、内置功能(如日志、速率限制、内容安全)、自定义开发方法及最佳实践。通过中间件,开发者能构建更健壮、可扩展的Agent系统,显著提升AI应用的可管理性和生产就绪性,是LangChain 1.0的核心特性之一。
2025-11-24 19:35:11
570
原创 收藏这篇!AI知识库与智能体:打造你的“数字印钞机“,小白也能轻松上手
文章指出,当前AI热潮中,真正的价值在于AI知识库和AI智能体这两个底层技术。AI知识库可将个人和企业的经验转化为"数字资产",解决经验流失问题;AI智能体则能让这些资产自动工作创造价值,实现"睡后收入"。真正能从中获益的是在特定领域有丰富经验的专业人士,他们可通过将这些经验"产品化"形成竞争优势。
2025-11-24 19:13:07
289
原创 AI时代程序员的逆袭之路:三大关键转变,助你成为不可替代的高薪人才,建议收藏!
AI不会淘汰程序员,但"不进化"的程序员会。程序员真正的护城河在于成为懂技术、懂业务、懂AI的复合型人才。要抓住AI时代红利,程序员需完成三大转变:学习AI底层逻辑、跨界学习业务、让AI成为助手。
2025-11-24 18:40:48
469
原创 【程序员必看】从知识增强到智能行动:RAG、Agent与MCP构建AI新生态,收藏学习必备!
本文解析了AI应用从单模型智能向多智能体协同的演进路径,详细介绍了三大核心技术:RAG提供实时知识增强,Agent实现自主任务执行,MCP建立标准化协作协议。三者分层协同,共同构建了现代AI应用的架构基础,推动AI应用从"模型中心"向"生态中心"转变,使企业能够组装更智能、协作性更强的AI系统。
2025-11-24 11:30:16
446
原创 AI时代产品经理生存指南:6大必备技能,值得反复收藏!
AI产品经理需从确定性思维转向概率性思维,掌握"需求×模型行为×经济学"的AI产品感知力。构建成功AI产品需六大技能:用户现实理解、模型行为把握、经济模型设计、系统架构规划、信任责任建立及市场策略制定。这要求产品经理深入理解概率模型、精算Token成本、设计容错系统并建立信任壁垒,而非简单套用Prompt模板。这些能力是AI产品从Demo到规模化落地的关键。
2025-11-24 10:32:56
637
原创 【收藏必备】大模型面试宝典2025版 | 精选50个大模型高频面试题!程序员面试通关秘籍
本文提供2024版大模型面试宝典,包含50个高频面试题,涵盖GPT与BERT区别、大模型架构、Transformer原理、微调技术、量化方法、RAG等核心知识点。
2025-11-22 19:49:28
418
原创 【程序员必藏】Transformer模型完全指南:37个细分章节详解大模型技术
本书是Transformer模型的权威指南,详细介绍60多种架构及相关技术,全书分7章37节,涵盖基础理论、BERT模型、多语言版本、变体改进、预训练应用及可解释性技术。书中提供丰富案例和可直接在Google Colab运行的代码,适合语音识别、NLP、时间序列分析和计算机视觉等领域的学习者。
2025-11-22 19:28:35
128
原创 收藏必备!32个提示工程技巧,让你与AI对话水平超越90%的程序员
文章系统介绍提示工程的32个核心技巧,从基础(清晰表达、提供上下文、结构化提示、迭代优化)到高阶(教学模式、推理技术、工具使用、减少幻觉)。掌握这些技巧可显著提升AI对话效果,使输出更准确专业,适用于编程、写作、信息提取等多种场景,是掌握AI应用的关键技能。
2025-11-22 15:16:32
485
原创 RAG技术全解析,24个RAG大厂八股文,架构转型必看,告别中年危机!!
详解了RAG技术,这种结合检索与生成的AI方法能提供更准确、更新的回答,减少"幻觉"。文章阐述了RAG的工作原理、架构、应用场景及优势,特别强调其在专业领域如医疗、法律中的价值,以及如何通过RAG实现架构转型,成为未来超级架构师。
2025-11-22 14:39:28
387
原创 一文详解:AI Agent(智能体)产业链全解,看到就是赚到,建议收藏!!
AI Agent(人工智能代理)可以理解为一个会自主办事的智能程序,它能像人一样感知周围信息、自己规划策略,然后动手完成任务。 比如你让它订周末的餐厅,它会先搞清楚你的需求(感知),接着拆解成查评分、看菜单、确认时间等步骤(规划),最后一步步执行预订(行动)。
2025-11-22 13:55:31
942
原创 从AI到AI Agent:程序员必学的智能体进阶指南,零基础小白收藏这一篇就够了!!
人工智能体(AI Agent)是AI发展的新阶段,从工具到智能伙伴的跃迁。它具备自主性、环境感知和持续学习三大特征,能自主理解目标、制定计划并执行任务。AI Agent的兴起源于需求推动、技术成熟和巨大价值,将降低重复劳动、提升决策效率,形成数字劳动力。未来,AI Agent将与人类并肩工作,但也带来数据安全、伦理责任和就业转变等挑战。掌握AI Agent技术将成为程序员的必备技能。
2025-11-22 11:53:31
554
原创 大模型微调全攻略:从数据构建到部署落地的完整指南(必读收藏)
本文基于IPO三阶段框架,系统解析大模型微调全流程:Input阶段强调高质量数据构建与关键技术选型;Process阶段聚焦工具链整合与多阶段训练策略;Output阶段注重效果评估与灵活部署。文章指出微调本质是用最小算力实现最大领域适配,高质量数据与场景理解是核心竞争力,建议初学者从"7B模型+免费云算力"起步,逐步积累经验完成从通用模型调用者到垂直领域专家的蜕变。
2025-11-22 11:34:06
923
原创 【深度收藏】RAG系统评估四维法:让你的大模型告别“幻觉“,答案更可靠
本文详解评估RAG系统检索能力的四大核心指标:召回率(确保资料完整性)、精确率(提高结果相关性)、平均精确率均值(优化排序质量)和平均倒数排名(保障首条结果体验)。强调评估RAG应先关注检索能力而非最终答案,并提供基于指标的系统优化方法,帮助开发者精准定位瓶颈,提升大模型回答准确性和可靠性。
2025-11-21 19:54:56
527
原创 【必学收藏】GraphRAG:大模型应用的质变飞跃,从搜索数据到推理洞察
本文探讨了传统RAG架构在大模型应用中的局限性,介绍了GraphRAG技术如何通过知识图谱解决复杂关系推理和全局性分析问题。GraphRAG实现了三个关键突破:多跳推理能力、查询聚焦式总结(QFS)和可解释性,使大模型从"搜索数据"升级为"推理洞察"。尽管面临构建成本和维护挑战,GraphRAG代表了企业级AI应用的重要发展方向,为复杂业务场景提供了更强大的解决方案。
2025-11-21 19:37:08
938
原创 【收藏】RAG检索增强生成:让大模型掌握最新知识的黑科技
RAG(检索增强生成)是一种结合检索与生成的AI技术,通过先从外部知识库检索相关信息,再结合检索结果和用户需求输入大模型,生成更准确、有依据的答案。它解决了大模型知识过期和幻觉问题,提升了答案的时效性、准确性和可追溯性。RAG的核心流程包括知识存储(文档嵌入)、相似度检索和增强生成三个环节,由外部知识库、检索引擎、大模型和数据处理模块组成,适用于企业知识库、智能客服等多种场景,相比重新训练模型成本更低、效率更高。
2025-11-21 19:16:03
587
原创 一文搞懂:从“大模型LLM”过渡并入门“多模态大模型MLLM,多模态大模型完整指南:从NLP到多模态的进阶之路
本文全面介绍多模态大模型(MLLM)的架构、训练与评估。详细分析两种主要架构:统一的Embedding解码器和跨模态Attention机制,以及预训练、指令调优、对齐调优三阶段训练方法。同时讨论评估方法、扩展技术、幻觉问题及未来方向,为NLP和LLM基础学习者提供系统性MLLM知识框架。
2025-11-21 11:59:48
563
原创 AI+运维开源工具:k8sgpt-operator实现集群故障自动诊断与修复,建议收藏!!
k8sgpt-operator是一款为Kubernetes集群注入AI运维能力的开源工具,可集成OpenAI或本地化AI大模型,自动分析集群故障并生成解决方案。文章详细介绍了安装部署流程、AI模型配置方法,并通过实际案例展示了如何自动检测和修复K8s集群问题,有效提升运维效率,是AI+运维领域的实用工具。
2025-11-21 11:47:06
688
原创 【AI大模型实战】扒开大模型外衣:手搓一个Qwen3,全程干货,小白也能轻松学会!!
阿里Qwen3是最新大型语言模型系列,包含旗舰模型和小型MoE模型。文章详细解析其模型结构,包括输入处理、Transformer块、自注意力机制、RMSNorm归一化和前馈网络,并提供完整PyTorch代码实现。通过Qwen3Model、TransformerBlock、GroupedQueryAttention等核心组件的代码展示,帮助开发者理解如何构建高效大语言模型,特别是GQA的创新应用。
2025-11-21 11:15:36
586
原创 一文读懂上下文工程(Context Engineering):提升AI应用性能的关键技术,建议收藏学习
上下文工程是设计AI系统如何获取和管理信息的实践,超越传统提示工程。通过整合对话历史、用户数据和外部文档等信息,构建更智能的AI系统。文章介绍了上下文工程在RAG系统、AI智能体等场景的应用,以及上下文污染、干扰等问题的解决方案。随着AI应用复杂化,上下文工程将成为构建高质量AI应用的关键技术。
2025-11-21 10:24:15
708
原创 程序员玩转AI的32个提示工程技巧,收藏起来慢慢学!读完认知超90%的人,不夸张!
文章系统介绍了提示工程的32个核心技巧,分为四大基础(清晰表达、提供上下文、结构化提示、迭代优化)和进阶方法(教学模式、激发推理、工具使用、减少幻觉等)。通过明确指令、角色设定、思维链、RAG等技术,提升与AI交互的精准度和效率,使AI从简单回答工具进化为能自主思考和行动的智能助手,适用于编程、创意写作等多种场景。
2025-11-20 19:53:54
911
原创 【收藏必看】大模型微调实战:从零开始学LoRA技术,成本降低99%的微调方法
文章详细介绍大模型LoRA微调技术,通过冻结原模型参数,训练小参数矩阵实现高效微调。LoRA技术解决全参数微调的存储和训练成本问题,降低约99%成本,同时保持90%以上效果。文章从原理到实践,讲解LoRA三大技术创新及完整训练部署流程,提供详细代码示例和解决方案,帮助开发者高效掌握大模型微调技术。
2025-11-20 19:41:19
1006
原创 手把手教你搭建AI知识库:大模型应用入门到精通,建议永久收藏!!
本文详细介绍了AI知识库的搭建方法,包括底层逻辑(收集、整理、调用)、应用场景(数据调用、智能客服、知识问答)和具体使用步骤。以ima和腾讯元器为例,演示了如何创建常规知识库和封装智能体调用,帮助读者建立个人知识库,让AI成为"第二大脑",实现高效知识管理和智能应用。
2025-11-20 19:21:34
917
原创 【必学收藏】TruthfulRAG:用知识图谱解决RAG系统知识冲突,提升大模型回答准确性的黑科技
TruthfulRAG创新性地将非结构化文本转化为结构化知识图谱,通过图构建、图检索和基于熵过滤的冲突解决三大模块,解决了RAG系统中外部知识与模型内部知识冲突的问题。实验表明,该方法在多个数据集和模型上显著提升准确性3.6%-29.2%,且结构化知识表示能增强LLM对正确答案的置信度,即使无冲突场景下性能也优于基线,为提升大模型回答可靠性提供了新思路。
2025-11-20 13:46:52
744
原创 【必藏】从会聊天到会思考:用LangChain 1.0+Qwen打造智能旅游Agent,掌握大模型深度思考实战
详细介绍了如何使用LangChain 1.0和Qwen模型构建具有深度思考能力的旅游Agent,从模型配置到中间件实现,包括思考预算控制、系统提示管理、工具调用约束和结果质检等。将Reasoning分为模型层、API/Middleware层和结构层三个层次,提供了可直接复用的中间件设计模式,帮助开发者构建能思考、可控的大模型应用。
2025-11-20 11:42:17
653
原创 【必读收藏】AI Agent的正确进化路径:为什么你的Agent总是“瞎做“?从感知开始构建真正智能
文章指出AI Agent行业存在重大误解,过分强调"规划+执行"而忽视"感知"环节。作者提出智能=感知×理解×决策×行动,认为当前Agent的瓶颈在于缺乏对世界的感知能力。未来Agent应从感知开始,通过丰富输入信息、构建记忆系统,才能实现真正可靠的智能。真正有竞争力的Agent不是最会规划的,而是能获取最多真实、连续信息的系统。
2025-11-20 10:30:06
991
原创 【收藏】LangGraph State完全指南:从原理到实践,打造高效大模型应用
LangGraph是一个状态图框架,State作为其核心组件贯穿整个生命周期。State是共享数据结构,由模式和reducer函数组成,用于存储和传递任务执行过程中的关键信息。State采用增量更新机制,自动保存支持工作流的暂停、恢复和回滚。在图的执行流程中,每个节点接收前一个节点的状态作为输入,处理后传递给下一个节点,确保多节点协作时信息的一致性和连续性。理解State机制对于构建稳定高效的大模型应用至关重要。
2025-11-20 10:07:57
935
原创 AI智能体进化论:从Agent 1.0到Agent 2.0,深度智能体架构详解(建议收藏)
文章探讨了AI智能体从Agent 1.0(浅层循环)到Agent 2.0(深度智能体)的演进。浅层智能体依赖LLM上下文窗口,面临上下文溢出、目标丢失等问题。深度智能体通过四大支柱解决复杂任务:显式规划、分层委托子智能体、持久化内存管理和极致的上下文工程。这一转变使AI智能体从反应式循环进化为主动式架构,能够处理需要数小时甚至数天的复杂任务。
2025-11-19 16:28:38
533
原创 Transformer模型深度剖析:注意力机制全解析【值得收藏】
Transformer是Google于2017年提出的革命性模型架构,完全基于注意力机制,摒弃传统循环结构。由编码器和解码器组成,通过多头注意力、残差连接解决长距离依赖问题,实现高效并行计算。广泛应用于机器翻译、文本生成等领域,是现代大语言模型如ChatGPT的基础。文章详细解析文本嵌入、QKV计算、自注意力、多头注意力、掩膜注意力和交叉注意力等核心机制,并介绍训练与推理流程。
2025-11-19 16:17:29
552
原创 【珍藏版】从MIT报告看大模型落地:95%企业失败的5个关键教训
MIT研究显示尽管78%企业采用生成式AI,但仅5%获得回报。通过分析300个失败案例,发现企业大模型项目失败的五大陷阱:工作流程僵化、情境化学习能力缺失、与日常运营脱节、风险预警机制不足、组织架构与人才准备不足。成功企业并非技术最先进,而是懂得"量体裁衣",将AI精准融入业务流程,而非盲目跟风。
2025-11-19 15:07:30
909
原创 【必收藏】Graphiti:AI代理的动态记忆革命,从传统RAG到实时知识图谱的跃迁
Graphiti是Zep AI推出的实时、时序感知知识图谱引擎,专为AI代理提供动态记忆支持。相比传统RAG,它能实时更新数据、快速检索(P95延迟仅300毫秒),并通过双时序模型保留历史准确性。基于Neo4j构建,支持自定义实体类型,无需LLM调用即可实现高效查询,解决了静态RAG在动态数据环境中的局限性,为AI代理提供了真正动态的记忆基础设施。
2025-11-19 14:17:31
694
原创 必学收藏!Modular RAG架构中模型选择与优化的全攻略
文章详细探讨了Modular RAG架构中各模块的模型选择与优化策略。从文本嵌入模型微调、查询优化、重排模型到检索与生成联合优化,分别介绍了不同技术发展历程、应用场景及具体方法,如GTE模型、RQ-RAG算法、JudgeRank和RankRAG等。针对不同任务和领域需求,文章强调了定制化模型训练和微调的重要性,为构建高性能RAG系统提供了实用指导。
2025-11-19 11:51:22
686
原创 【建议收藏】多模态检索技术详解:三大模型(GME/CLIP/VISTA)横向对比与实战选型
文章介绍了多模态检索技术的核心逻辑及三种主流表征模型(GME、CLIP与VISTA)的技术细节、性能特点与适用场景。多模态检索通过统一模型实现文本、图像、视频等不同类型信息的跨模态搜索,核心是将不同模态内容转换为高维向量计算语义相似度。文章从参数量、性能、适用场景等方面横向对比了三种模型,并提供了基于语言场景、检索类型和算力预算的选型建议。
2025-11-19 11:16:02
570
原创 【必收藏】AI Agent智能体设计模式实战指南:揭秘提示链模式的工程实践
文章介绍了智能体设计模式实战系列的第一篇——提示链模式。提示链是将复杂任务拆分为多步流水线,每步由专门提示负责,前一步输出作为后一步输入。这种模式解决了指令管理、输出结构化和可维护性问题,使Agent更可控、可维护。文章通过从文档到报告的实际案例展示了提示链的实现方法,并提供了先画流程再写提示、中间结果结构化等实用心法。适合从"写Prompt调模型"升级到"设计Agent架构"的开发者学习。
2025-11-19 10:25:36
822
原创 【技术分享】大模型Agent的“灵魂“:上下文工程与记忆系统构建指南
本文深入探讨了构建高效大模型Agent的关键要素,强调Context Engineering比Prompt Engineering更重要。文章阐述了Session与Memory的区别、多Agent协作中共享Memory的思路、长上下文管理方法,以及记忆系统的ETL设计。核心观点是:优秀Agent需要建立状态、积累经验、主动忘记,形成持续存在的个体特征,这需要通过精心设计的上下文工程和记忆系统实现。
2025-11-18 15:19:34
228
原创 强烈收藏!Google最新Agent白皮书详解:从理论到实践构建生产级AI Agent
Google最新Agent白皮书从概念验证转向生产级系统构建指南,详细介绍Agent定义、五步工作循环和5级分类法。内容涵盖Multi-Agent系统架构、部署运维策略、评估方法、交互机制及安全防护,为开发人员提供构建可靠AI Agent系统的完整框架和最佳实践,是入门进阶的必备参考资料。
2025-11-18 15:07:06
325
原创 一文读懂大模型技术路径:训练与微调的区别、应用与选择策略【建议收藏】
本文详细对比了模型训练与微调两种大模型技术路径的区别。模型训练从零开始构建基础模型,需要海量数据、强大计算资源和长时间,成本高;而微调基于预训练模型进行特定领域训练,成本低、时间短、技术门槛低。文章探讨了两种方法的技术特点、应用场景和选择策略,帮助开发者和企业根据资源条件高效打造专属AI助手。
2025-11-18 14:50:36
1020
原创 收藏必备!DeepSeek-V3.2-Exp:稀疏注意力机制让大模型效率提升10倍,成本降低50%
DeepSeek-V3.2-Exp创新采用稀疏注意力(DSA)机制,通过"闪电索引器"将计算复杂度从O(L²)降至O(Lk),实现推理速度提升2-3倍,成本降低超50%。两阶段训练流程确保DSA有效整合,在编码和代理任务上表现更优,为AI效率提升提供新思路。
2025-11-18 14:23:23
599
原创 【必学收藏】大模型中的Token到底是什么?小白也能看懂的深度解析
本文详细解释了大模型中的Token概念,它是模型处理文本的最小单元,介于字和词之间的子词或字节序列。文章介绍了Token的分词方式、计算方法及不同模型的差异,并讲解了在开发应用中如何计算Token用量以控制成本和上下文长度。理解Token对开发大模型应用至关重要,特别是在计费、文本分块和向量数据库结合等方面。
2025-11-18 11:46:39
374
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅