自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1985)
  • 收藏
  • 关注

原创 企业级RAG系统实战指南:2万+文档处理经验与10个项目踩坑总结(珍藏版)

本文分享了企业级RAG系统构建的实战经验,涵盖文档质量评分、层级化分块、元数据架构和混合检索等关键技术要点。作者通过10+个项目实践,提出企业RAG是70%工程+20%领域知识+10%模型的综合挑战,并提供了详细的代码示例和解决方案,帮助开发者构建高效可靠的企业级文档检索系统。---

2025-11-24 11:23:36 817

原创 程序员必学:从零开始掌握大模型Embedding技术,附向量检索实战案例

文章详细介绍了Embedding技术,包括其定义、工作原理、相似度计算方法和常见模型。重点讲解了为什么需要将文本转换为向量,以及如何使用向量数据库实现高效的语义检索。通过LangChain4j、阿里text-embedding-v4和Milvus的实战案例,展示了如何构建完整的文本嵌入和检索系统,帮助读者从理论到实践全面掌握这一大模型核心技术。

2025-11-24 10:59:22 742

原创 【收藏必备】解决RAG检索两大痛点:混合检索与重排序实践指南

本文探讨RAG应用中单一检索策略的局限性,专有名词匹配失败和语义漂移问题。作者提出混合检索(结合向量检索与BM25)和重排序(Cross-Encoder模型)的解决方案。混合检索通过RRF算法融合结果提高召回率,重排序则对候选文档精细筛选提高精确度。这种"粗排+精排"分层架构是构建高精度RAG系统的基石,特别适用于法律、医疗、金融等对精确度要求高的领域。

2025-11-24 10:49:47 502

原创 【深度收藏】RAG系统性能衰减分析与优化:从工程实践到面试通关指南

本文深入分析了RAG系统随运行时间变慢的四大原因:embedding计算增多、向量库膨胀、重排序模型变重、模型生成变慢。提供了系统调优方案,包括embedding优化(批处理+缓存+异步)、向量库优化(HNSW+分区+清理+多副本)、答案缓存和Prompt优化。文章强调RAG是工程而非魔法,需要全链路调优和工程能力,适合希望在实际项目中应用RAG技术的开发者学习收藏。

2025-11-24 10:43:10 511

原创 【收藏】从零开始学AI Agent:8大框架全方位对比,企业开发者必看

本文对比分析了LangChain、LlamaIndex等8个主流AI Agent框架,从技术栈、开发门槛、核心优势及适用场景进行全方位解析。文章提供了按使用场景、团队能力和私有化需求分类的选型决策指南,帮助企业和开发者快速找到最适合的AI Agent解决方案,无论你是零代码小白还是资深开发者,都能从中获益。

2025-11-24 10:38:49 769

原创 大模型分词器vs传统中文分词:技术原理+实战案例,一篇让你收藏并彻底搞懂!

文章深入解析大模型分词器与传统中文分词的核心区别,包括子词切分算法、BM25检索敏感度对比、字节级BPE优势等。同时探讨大模型如何区分对话角色、处理工具调用、用户行为嵌入及一词多义问题,揭示静态词嵌入与上下文嵌入的差异与价值,为开发者提供全面的技术理解与实用指导。

2025-11-23 09:15:00 968

原创 大模型框架对比精选:Spring AI、LangChain、LangGraph和LlamaIndex全方位解析(建议收藏)

本文全面对比分析四种主流大模型开发框架:Spring AI适合Java企业环境集成,LangChain擅长复杂NLP应用,LangGraph专注有状态工作流,LlamaIndex优化数据检索性能。文章从架构特性、适用场景、表现限制等多维度剖析,提供详细技术选型指南和最佳实践,帮助开发者根据项目需求与团队能力做出明智决策,并探讨混合架构策略与未来趋势。

2025-11-22 10:04:42 594

原创 【必收藏】大模型风口下的AI产品经理:零基础入门指南,30-50万年薪等你拿,18个月黄金期抓紧上车

AI产品经理正处于史上最大转岗红利期,岗位需求同比暴涨240%,年薪中位数达30-50万,供需比1:3.8,人才缺口超135万。这一职业爆发是技术成熟、政策推动与人才短缺三重力量共振的结果。成为AI产品经理需具备六项核心能力:场景翻译力、技术认知力、数据工程力、产品方法力、量化体验力和合规伦理力。当前红利窗口期仅剩18个月,零基础转型者应把握机会,系统学习大模型技术,抢占AI人才高地。

2025-11-22 10:01:41 734

原创 收藏!AI产品经理必备宝典:4类业务题+大模型学习资料,建议收藏学习

文章介绍了AI产品经理需掌握的四类业务题(产品理解、技术认知、业务场景、工程落地),涵盖AI核心要素、模型训练评估、产品设计部署等关键问题。同时提供大模型学习资料,包括教学内容、学习路线图、视频教程、行业报告和面试题等,适合不同背景学习者入门和进阶AI大模型技术。

2025-11-22 09:59:06 964

原创 【收藏必看】AI工程学习路线图:从Python基础到多智能体系统,大模型入门全攻略

文章提供了一条完整的AI工程学习路线图,从Python基础到多智能体系统,涵盖机器学习数学、LLM基础、智能体开发等核心方向,并推荐各阶段优质学习资源。AI工程学习逻辑是"从基础工具→核心技术→系统协作"的逐步深入过程。文章强调AI大模型正在改变各行各业,相关岗位需求激增,希望通过这份系统化的学习资料,帮助有志于AI领域的朋友高效入门并掌握核心技能。

2025-11-22 09:56:15 535

原创 【必收藏】从零构建大模型(二):数据获取与清洗全攻略,小白也能快速上手

大语言模型构建的核心在于高质量数据集的建立。文章详细介绍了两大数据来源:网络文本(如Common Crawl)和知识库(如维基百科),以及数据清洗与预处理四步流程:质量筛选、文本标准化、去重处理和语种过滤。同时,讲解了如何设计数据结构(文档、问答、对话格式)和生成标准化文件,帮助读者系统构建适合大模型训练的高质量数据集,为从零构建大模型奠定坚实基础。

2025-11-21 15:26:33 1057

原创 大模型开发宝典:硬核技能+软实力,助你抓住AI风口,收藏学习!

AI大模型应用开发需掌握Python编程、机器学习基础、大模型专项技术(Prompt工程、RAG、微调)及数据处理能力,同时培养问题分解、持续学习等软技能。文章提供从理论到实战的学习路径,推荐常用工具栈,强调开发者应成为"全栈AI工程师",从小项目开始实践积累。

2025-11-21 15:21:06 939

原创 值得收藏 | 从通用到专用:LLM与SLM的选型之道及企业落地指南

文章对比分析了大型语言模型(LLM)和小型语言模型(SLM)的特点与应用场景。SLM凭借参数精简、领域专精、部署灵活和成本优势,在垂直领域表现突出;LLM则在通用场景和复杂任务中更具优势。通过实战案例和选型指南,帮助开发者根据业务需求、资源预算和合规要求选择合适模型,预测SLM将成为国内企业AI转型的主流选择,实现从"全能"向"精准适配"的技术回归。

2025-11-21 15:16:01 760

原创 收藏必备!大模型能力评估体系详解:指标、方法与实践

本文系统介绍了大语言模型的评估指标与方法。评估指标涵盖分类任务(准确率、精确率等)、语言模型(交叉熵、困惑度)和文本生成(BLEU、ROUGE)三大类。评估方法包括人工评估(贴近人类判断但成本高)、大语言模型自评(高效但依赖评估模型质量)和对比评估(适用于模型性能比较)。文章详细分析了各类方法的优缺点、适用场景及实施细节,为全面评估大模型能力提供了实用指南。

2025-11-21 15:13:05 734

原创 【珍藏版】从零开始学提示词工程:解决AI输出“差一点“问题的完整指南

本文提出工程化Prompt方法论,通过五段式模型(角色、目标、输入、过程、输出)结合参数配置和上下文工程,解决AI输出不稳定问题。强调结构化提示、提供完整上下文、拆分复杂任务的重要性,并提供了Few-shot、Chain of Thought等高级技术,帮助用户构建可控、稳定的大模型协作方案,显著提升输出质量。

2025-11-21 15:00:47 1012

原创 【程序员必看】上下文工程:AI时代的“泥瓦匠“,让你的模型真正理解人类

上下文工程是弥合人类与AI认知鸿沟的关键技术,通过建立丰富有效的上下文,将人类高熵意图转化为机器低熵指令。它包含三大核心构件:多模态上下文收集与分层记忆系统、上下文抽象管理机制、以及基于逻辑依赖的上下文选择系统。随着AI技术发展,上下文工程将从外部脚手架逐步融入模型核心架构,最终成为人机交互的基础设施,实现无需额外说明的完美人机协作。

2025-11-20 10:23:33 674

原创 大模型技术全解析:从LLM到Agent,一篇搞定收藏必备

《深入探讨大型语言模型(LLM)及其相关技术》一文系统解析了LLM基础概念、ChatGPT对话应用、检索增强生成(RAG)、函数调用(Function Call)、智能体(Agent)和模型上下文协议(MCP)等核心技术。文章详细阐述了各技术的原理、特点、应用场景及相互关系,展示了如何通过这些技术的协同工作构建更强大的AI系统,为读者提供了全面的大模型技术学习路径。

2025-11-20 10:17:58 938

原创 【值得收藏】AI Agent技术详解:从入门到实战,大模型开发者的必学技能

AI Agent是基于大语言模型的智能体系统,具备自主决策、工具调用和记忆管理能力,包含记忆、规划和工具调用三大核心模块。当前技术已发展为包含规划、工具、记忆和行动四大组件的完整体系,在企业级与消费级场景双线并行发展。未来趋势聚焦多模态融合、安全治理和低代码开发,市场规模预计将爆发式增长。AI Agent开发需架构师、Prompt工程师和多模态专家三大角色协同,主流框架包括LangChain、MetaGPT等,开发者需掌握RAG与多模态融合技术构建高效系统。

2025-11-20 10:14:54 1096

原创 收藏必备!大模型微调全指南:从选择到实战,一文读懂何时该微调大模型

文章探讨微调大模型的必要性,指出在需要专业准确度、个性定制、处理特殊案例或降低成本时应选择微调。分析微调缺点(数据成本高、更新慢、可能丧失常识),对比RAG技术,建议根据数据特点、预算和应用场景选择。技术选型应匹配业务需求、团队能力和预算。

2025-11-20 10:10:08 501

原创 Java开发者如何转型大模型?这篇攻略助你成为AI复合型人才(建议收藏)

本文为Java开发者提供向AI大模型领域转型的全面指南,分析了Java开发者的现状与转型优势,规划了四种转型路径,提出了核心技能提升策略,并详细阐述了如何将Java工程经验转化为AI项目的价值。文章还提供了从初级到高级的实战项目建议、分阶段学习计划、资源清单以及转型陷阱规避策略,强调Java开发者应"保Java攻AI",将工程思维与AI技能相结合,成为复合型人才,抓住AI时代的职业发展机遇。

2025-11-20 10:05:27 446

原创 【必学收藏】RAG知识库构建五步法:从零到一打造大模型面试加分项

本文详解RAG知识库构建五步法:文档解析、内容清洗、语义分块、向量化、索引构建,强调知识库质量直接影响RAG系统效果。文章从工程思维出发解析底层逻辑、陷阱与优化技巧,提供面试简洁回答版本,帮助读者理解知识库构建是RAG系统的核心基础。

2025-11-19 10:55:47 1043

原创 深入理解大模型Attention机制:Q与K为何要分离?数学原理与实例解析(建议收藏)

文章从数学角度和直观例子分析了Attention机制中Q(query)和K(key)的区别与作用。当Q=K时,Weight矩阵变为对称半正定矩阵,降低了模型对非对称场景的处理能力,减弱了模型的表达能力。虽然技术上不一定要区分Q和K,但在self-attention中,Q与K的分离增强了模型的表达能力,使得模型能够更好地捕捉序列中不同位置之间的关系。

2025-11-19 10:51:49 828

原创 Agent项目简历怎么写才能脱颖而出?收藏这份大模型面试加分秘籍!

这篇文章详细介绍了大模型Agent项目简历的撰写方法,强调应突出工具定义、控制策略、决策逻辑和监控反馈四大核心要素。作者指出,简历重点应展示模型如何自主决策调用工具、工作流设计与控制策略,而非简单堆砌技术名词。文章提供了具体项目案例和面试回答模板,帮助求职者清晰表达自己在Agent架构中的核心贡献,让面试官在三秒内看到价值,从而在众多候选人中脱颖而出。

2025-11-19 10:47:17 710

原创 收藏!AI赋能HR实战指南:五大应用场景详解,程序员必学

文章探讨了AI在HR领域的五大应用场景:智能招聘、实战培训、课程生成、领导力辅导和员工服务。AI落地分为三个阶段:功能型解决单一痛点、工具型优化关键流程、业务型成为业务伙伴。AI不会取代HR,但会淘汰只停留在事务处理层面的HR角色,真正有价值的HR将是那些敢于拥抱变化、亲自打磨AI应用的人。

2025-11-19 10:44:11 675

原创 【程序员必看】Transformer与MoE:大模型架构的演进与选择指南

文章解析了大模型中Transformer与MoE架构的关系。Transformer通过自注意力机制处理序列数据,而MoE并非替代品,而是通过条件计算扩展Transformer的方法。MoE引入多个专家网络和路由器,仅激活部分参数处理特定输入,实现更高模型容量而不成比例增加计算成本。Transformer采用密集计算,所有参数参与每个预测;MoE则实现专业化分工。两者结合可能是未来大模型的发展方向,选择取决于具体应用场景和需求。

2025-11-19 10:41:08 585

原创 大模型修炼秘籍:从海量文本到智能对话的三阶段成长指南(建议收藏)

大语言模型训练分三阶段:预训练阶段,模型通过学习海量互联网文本掌握语言规律和世界知识,成为"文本模拟器";监督微调阶段,通过高质量对话范例让模型学会遵循指令,成为智能助手;强化学习阶段,通过试错和奖励机制培养模型自主思考能力,使其能解决复杂问题。三阶段协同作用,将原始神经网络雕琢为功能强大的AI助手。

2025-11-18 10:33:06 858

原创 【强烈推荐收藏】Agent从入门到精通:小白也能看懂的核心组件与工作原理

文章介绍了Agent的定义及其三大核心组件:模型(思考决策的"大脑")、工具(执行操作的"手脚")和指令(规范行为的准则)。Agent不同于传统LLM,不仅能对话思考,还能实际执行任务完成目标。整个Agent系统形成一个"思考-行动-调整"的闭环,能够独立完成复杂任务,是AI领域的重要发展方向。

2025-11-18 10:29:36 973

原创 收藏必学!从零开始构建你的Agentic AI:当数据会思考,代码有决策力的完全自主数据分析实战指南

文章深入解析AI Agent的核心架构与开发实践,涵盖规划、记忆、工具调度等关键模块,详细介绍了基于大模型的Agent系统构建方法,包括上下文工程优化、记忆系统设计与函数调用实现。通过Dola数据分析Agent案例,展示了从Workflow到Agentic AI的演进过程,为开发者提供了从理论到实践的完整开发指南。

2025-11-18 10:26:50 795

原创 收藏!小白也能看懂的AI智能体详解:从入门到实践指南

本文以通俗易懂的方式讲解AI智能体概念,强调其与传统大模型的区别在于自主性。AI智能体能拆解任务、调用工具自主完成目标,包含大脑(规划)、感知(接收输入)和行动(执行操作)三大核心组件。文章分析了从ChatGPT到各类智能体平台的能力差异,指出多数产品尚处于创建平台阶段。理解智能体概念并打造个性化智能体军团,是让AI真正助力工作生活的关键。

2025-11-17 11:21:56 696

原创 【必收藏】2026年AI技能全景图:九大核心能力助你成为智能编排者

文章预测2026年AI核心竞争力将转向"驾驭"和"构建"AI系统。作者提出九大核心AI技能:精准交互与多模态理解、RAG与微调、自动化与智能体、创意与管理等,构成从基础到高阶的能力矩阵。掌握这些技能能帮助人们从简单的AI使用者转变为"智能编排者",整合模型、数据与工作流,在AI时代掌握主动权,成为定义未来的创造者。

2025-11-17 11:11:56 346

原创 【程序员必藏】一文搞懂LLMs、RAG与AI Agent:AI应用开发三大支柱详解

文章介绍了AI应用的三大核心概念:LLMs(大语言模型)作为"天才大脑"提供思考能力;RAG(检索增强生成)作为记忆系统解决LLMs知识更新问题;AI Agent作为智能体具备感知、规划、执行能力。三者并非竞争关系,而是在不同层面满足不同需求,未来趋势是将三者结合构建AI应用系统,用LLMs思考、RAG确保准确性、Agent实现自主性。

2025-11-17 11:04:44 998

原创 收藏必备!深入理解AI Agent与Agentic AI:测试开发人员的智能化跃迁指南

文章系统辨析了AI Agent与Agentic AI的本质差异:前者是按任务执行的自动化工具,后者是具备自主决策能力的智能体。Agentic AI通过目标驱动、自我反思和多智能体协作实现主动探索与持续学习,能提升测试开发的决策力而非仅提高效率。企业可通过记忆体、反思机制等技术实现Agentic AI落地,推动测试开发从"做得快"向"做得聪明"转变,开启AI与人类共创决策的新时代。

2025-11-17 10:24:27 653

原创 【珍藏必学】解锁大模型文本编码潜力:三种高效微调策略详解与实战指南

文章介绍了提升大语言模型(LLM)文本编码能力的三种技术路线:1)直接使用预训练模型隐藏状态,零成本但效果有限;2)微调编码头,包括分类任务和相似度度量两种方式,能显著提升特定任务性能;3)专为RAG场景微调,使用bi-encoder结构实现高效检索。这三种方法代表了成本与效果的不同权衡,选择合适策略可显著提升大模型应用效果,实现"四两拨千斤"。

2025-11-16 09:00:00 642 1

原创 收藏学习:大模型应用开发中提示词工程与上下文工程的核心区别与应用

文章解析AIGC应用开发中提示词工程(关注单次对话质量)与上下文工程(关注多轮交互连贯性)的区别。不同应用类型需求不同:聊天助手、Agent和Chatflow依赖上下文工程,工作流和文本生成更需提示词工程。提供系统提示词的Role-Goal-Rules-Few-Shot框架及上下文工程策略,帮助开发者优化AIGC应用性能。

2025-11-16 08:30:00 738

原创 收藏必备!大模型技术深度解析:从基础到PEFT与量化优化全攻略

本文全面介绍大语言模型核心技术,涵盖Transformer架构、预训练与微调流程,以及参数高效微调(PEFT)技术如LoRA、QLoRA和适配器。同时详细讲解模型优化策略,包括量化(GPTQ、NF4)、知识蒸馏和剪枝技术,以及提示工程方法如思维链和ReAct。为开发者提供从基础理论到实践应用的完整技术指南,帮助理解大模型的构建、优化与部署全流程。

2025-11-15 08:45:00 2010

原创 【强烈收藏】AI智能体核心术语大全:30个关键词助你快速入门大模型开发

本文系统梳理了AI智能体领域的30个核心术语,分为四大类:基本构成单元(智能体、环境等)、能力扩展与自我优化(工具、反思等)、记忆知识与约束(上下文窗口、护栏等)、多智能体协作与系统架构(编排、分层智能体等)。这些术语是构建高效AI智能体系统的基础知识,对AI初学者和转行者具有重要参考价值,助你快速掌握Agentic AI开发核心概念。

2025-11-15 08:00:00 583

原创 【必学收藏】8种大模型RAG系统文本分块策略,小白也能轻松掌握!

文章详细介绍了8种RAG系统中的高级文本分块策略,包括滑动窗口、自适应、基于实体、混合、任务感知、HTML/XML标签、代码AST拆分和正则表达式分块。这些策略针对不同场景和需求,如保留跨边界上下文、处理结构化文档、构建知识库等。文章强调好的分块策略需综合考虑内容类型、任务类型和文档结构,选择或组合合适方法,以提升RAG系统效果。掌握这些策略并结合具体场景实验,能显著提升系统性能。

2025-11-14 11:34:54 710

原创 程序员必学!AI大模型技术全解析:从入门到实战的四阶学习路径(建议收藏)

文章系统介绍AI发展的四个阶段及大模型四阶技术(提示工程、AI智能体、微调、预训练),详细解析其应用场景与特点。强调AI时代创造性解决问题等技能价值提升,提供学习路径,帮助读者在AI浪潮中找到定位,抓住发展机遇。

2025-11-14 11:32:27 883

原创 程序员必收藏!大模型RAG技术深度解析:从NaiveRAG到AgenticRAG的完整学习路径

本文全面回顾了RAG检索增强生成技术的发展历程,详细介绍了从NaiveRAG到AgenticRAG的五大范式演进,分析了每种范式的特点与创新点。文章梳理了RAG的关键进展,总结了工程实践工具,探讨了系统构建痛点和解决方案,为读者提供了RAG技术的完整知识体系和实践指导,助力开发者构建高效准确的大模型应用系统。

2025-11-13 10:49:05 975

原创 AI Agent开发:手写代码与四大框架全对比,小白也能快速上手

本文通过高考信息查询AI Agent案例,对比手写代码与LangChain、QwenAgent、AgentScope四大框架在业务编排、模型调用、工具集成、记忆管理和多Agent协作等方面的差异。分析表明框架能显著降低开发门槛,各具特色:LangChain适合单体智能体,QwenAgent适合Qwen模型应用,AgentScope擅长多Agent协作,手写代码则适合高度定制场景。为AI Agent开发提供了实用的选型参考。

2025-11-13 10:44:05 565

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除