自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 【LangChain_V1.0从入门到实践】专栏导言:拥抱AI应用开发的新范式

进行讲解,LangChain 1.0版本的发布是一个重要的里程碑,它是一次**“刮骨疗毒”式的架构重构**。这标志着一个根本性的。无论是简单的文本生成任务,还是需要集成外部工具和知识库的复杂智能代理,LangChain都能提供优雅的解决方案。无论你是希望将AI能力集成到现有产品中的软件开发工程师,还是寻求技术转型的传统程序员,或是需要了解技术实现细节的产品经理,都能从本专栏中获益。对于有一定经验的开发者,可以直接跟随专栏的代码示例和项目实践,快速掌握LangChain的核心用法和高级特性。

2025-11-25 15:30:10 667

原创 【机器学习】直观理解DPO与PPO:大模型优化的两种核心策略

PPO和DPO代表了让大模型符合人类偏好的两种不同哲学。PPO通过复杂的多模型协作实现精细控制,适合复杂任务;DPO通过直接学习偏好数据实现高效优化,适合数据充足且目标明确的场景。理解它们的本质区别,有助于我们在实际应用中做出更明智的技术选型,让AI更好地服务于人类需求。

2025-12-19 14:42:59 806

原创 【LangChain】LangChain智能体陷入“鬼打墙”?别急,全面急救方案在此!

智能体在执行任务时,陷入一种无法终止的循环状态,无法输出有效结果。比如:你让Agent搜索“特斯拉最新车型与续航”,它却可能在“搜Cybertruck”➡️“搜Model 3”➡️“又搜Cybertruck”之间无限轮回,直到达到调用上限或超时——任务失败,费用爆炸。稳定Agent =深度防御✅治本:清晰终止条件 + 粗粒度工具✅治标:迭代上限 + 超时机制✅监控:状态跟踪 + 详细日志✅调教:反循环提示 + 思维链引导。

2025-12-19 12:20:06 289

原创 LLM推理框架终极选型指南:vLLM、SGLang、Ollama等六大框架实战对比

本文深入分析2025年主流LLM推理框架选型策略,对比vLLM、SGLang等六大框架的核心特性与应用场景。vLLM适合高并发在线服务,SGLang优化复杂交互任务,Ollama是个人开发首选,TGI/XInference/LightLLM分别面向企业级稳定、云原生和轻量级部署需求。文章提供决策流程图和实战验证建议,强调应根据业务需求进行概念验证测试,并指出多框架融合、硬件优化等未来趋势。帮助开发者基于实际场景做出最优技术选型。

2025-12-12 21:13:21 964

原创 大模型微调技术选型实战指南:全参数微调、PEFT、RAG到底怎么选?

在实际业务中,我们主要面临三种技术选择,它们各有特色,适用于不同场景。

2025-12-12 20:58:30 660

原创 【LangChain_V1.0从入门到实践】基本篇完结寄语

《LangChain V1.0从入门到实践》专栏已完结,系统讲解了从基础到高阶的AI智能体开发知识体系。专栏涵盖12个核心章节,包括基础概念、工具/记忆/中间件三大支柱、工程化优化及RAG/多智能体等高级主题,形成完整的开发地图。作者感谢读者支持,并预告将推出项目重构、部署实践等进阶内容。专栏提供完整章节清单,邀请读者反馈学习体验和需求,共同探索AI应用开发的深度实践。

2025-12-11 08:56:12 1753

原创 【LangChain_V1.0从入门到实践】第12章:多智能体Agent

摘要:LangChain 1.0支持构建多智能体系统,主要包括集中式(Supervisor-Worker)和切换式(Hand-off)两种架构。集中式架构通过主智能体协调多个专业子智能体完成复杂任务,如预定会议和发送邮件场景中,主智能体调用日历子智能体和邮件子智能体协同工作。该模式适用于任务可明确分解的场景,是当前LangChain推荐的主要实现方式。文中提供了Python实现示例,展示了如何创建日历管理、邮件发送等专用子智能体,并通过主智能体统一调度完成端到端任务处理。

2025-12-10 08:23:19 1043

原创 【LangChain_V1.0从入门到实践】第11章 RAG

摘要 RAG(检索增强生成)技术通过结合信息检索和大语言模型生成能力,解决了知识过时、专业领域不足等问题。本文以文本型PDF处理为例,展示了RAG的实现流程:1)使用PyPDFLoader读取PDF;2)通过RecursiveCharacterTextSplitter分割文本;3)利用nomic-embed-text模型进行文本向量化;4)将向量存入Chroma数据库。最后构建问答系统,通过检索增强生成准确回答。该方案适用于知识库问答、专业领域咨询等场景,显著提升回答的准确性和时效性。

2025-12-09 08:30:07 1222

原创 程序员如何应对35岁危机?不是终点,而是职业新起点

35岁不应该是职业终点,而是重新审视职业规划的机会。经验和深度思考能力是年轻程序员难以替代的宝贵财富。正如一位资深技术人所说:“35岁正是工作的黄金年龄,只要有一个良好职场心态,有出色的工作业绩,还能让领导知道自己会干事和能干成事,中年危机就不一定会落在我们身上”。你的价值不在于年龄数字,而在于你能解决多大问题。掌握自己的发展方向,35岁后的程序员生涯可以更加精彩。你有哪些应对职业焦虑的经验?欢迎在评论区分享你的想法!

2025-12-08 09:10:40 484

原创 【LangChain_V1.0从入门到实践】第10章 Runtime

LangChain 1.0 的是一个核心架构,为智能体(Agent)提供执行环境和上下文管理能力。它基于 LangGraph 运行时构建,让开发者能够访问和管理智能体运行时的关键信息。LangGraph 公开了一个Runtime。

2025-12-08 08:48:58 146

原创 超越GPT的底层魔法:Transformer

回到我们开头的例子,现在你应该理解了Transformer是如何通过自注意力机制智能地理解指代关系的。这种模仿人类注意力分配机制的设计,让机器在语言理解方面迈出了巨大的一步。Transformer的成功证明了一点:有时,突破不在于增加复杂度,而在于找到更优雅、更本质的解决方案。自注意力机制正是这样一种简洁而强大的思想,它让我们向真正理解语言的机器又迈进了一大步。本文通过具体例子剖析了Transformer的核心机制。

2025-12-07 09:57:09 1010

原创 2025程序员面试避坑全攻略:四类假招聘陷阱与反制手册

面试本质是双向选择与展示的平台。面对陷阱,程序员需保持警惕,但也不必过度猜疑多数正规公司。核心是在保护好自身权益和安全的前提下,积极争取真正适合自己的机会。在职业发展的道路上,敏锐的辨别力与扎实的技术实力同等重要。希望这份指南能助你在2025年及未来的求职途中绕开暗礁,驶向理想的职业港湾。你是否也曾遇到过类似的面试陷阱?或者有独特的识别与应对经验?欢迎在评论区分享你的故事与见解,共同守护程序员求职环境的清朗!

2025-12-05 20:02:39 617

原创 技术高手为何成财富低能儿?资本只认结果,不为技术难度买单!

摘要: 技术高手的财富困境源于商业逻辑与认知误区。尽管程序员薪资可观,但996高压与35岁危机凸显职业脆弱性。资本只为结果买单,而非技术难度——过度专注代码而忽视商业价值,使许多开发者困在价值分配链末端。稀缺性才是关键:技术必须转化为可复用的解决方案,或与业务需求深度结合。真正的技术高手应转型为“价值创造者”,通过技术产品化、培养商业思维及把握交叉领域稀缺性,重构自身在产业链中的定位。技术不是终点,而是撬动财富的工具,认知升级才是突破收入天花板的核心。

2025-12-05 09:55:28 929

原创 【LangChain_V1.0从入门到实践】第9章 结构化输出

LangChain 1.0引入了结构化输出功能,将语言模型的自然语言输出转换为可程序解析的格式(如JSON或Pydantic模型)。该功能通过四种策略实现:工具调用、供应商原生、智能选择和禁用。支持Pydantic模型、TypedDict、DataClass和JSON Schema四种定义方式,各具特点:Pydantic提供全面验证,TypedDict轻量级,DataClass简洁,JSON Schema标准化。结构化输出提升了数据可靠性、简化开发流程并优化性能,使AI应用更健壮高效。实际使用时需根据模型提

2025-12-05 09:22:09 911

原创 深度学习四巨头:CNN、RNN、GAN、Transformer的爱恨纠葛

CNN、RNN、GAN和Transformer的关系,好比不同的专业工具——锤子、螺丝刀、锯子和万用扳手。每种工具都有其专长领域,但在构建复杂系统时,我们需要灵活组合使用它们。作为AI从业者,理解这四大架构的独特优势和相互关系,有助于我们在面对实际问题时做出更明智的技术选型。不要追求“万能”的架构,而要培养根据任务需求选择合适工具的能力。希望这篇文章能帮助你理清CNN、RNN、GAN和Transformer之间的关系。如果你有具体应用场景想讨论,欢迎在评论区留言!

2025-12-04 09:37:18 628

原创 【LangChain_V1.0从入门到实践】第8章 流式输出Streaming

LangChain 1.0的流式输出特性通过三种模式提升应用响应速度:updates模式展示智能体执行进度,messages模式实现逐字文本输出,custom模式支持自定义数据流式传输。开发者可通过.stream()或.astream()方法实现同步/异步流式处理,灵活选择单一或多模式组合(如["updates","messages"])来满足不同场景需求。该特性有效解决了大模型响应延迟问题,同时提供丰富的执行过程可视化能力。

2025-12-04 09:30:17 320

原创 MCP,你真的懂了吗?

让AI从“闭门造车”变成“万事通”你是否曾经感叹,虽然AI大模型很强大,但它好像一个“闭门造车”的学者——知识渊博却不懂实际操作?比如,它能够解释如何分析数据,却无法直接连接你的数据库;它能描述生成报告的过程,却不能直接操作你的办公软件。MCP(模型上下文协议)的出现,正是为了彻底解决这一痛点。

2025-12-03 08:40:27 814

原创 【LangChain_V1.0从入门到实践】第7章 记忆(Memory)

本文介绍了AI智能体中记忆系统的实现方法,重点讲解了短期记忆的使用和持久化存储。短期记忆通过checkpointer参数实现,能够保存单次对话的上下文信息。文章展示了内存存储(InMemorySaver)和PostgreSQL持久化存储(PostgresSaver)两种方式,并提供了完整的代码示例。此外,还介绍了如何通过扩展AgentState类来实现定制化记忆功能,使智能体能够存储更复杂的结构化信息,如旅行规划中的目的地、预算等数据。这种扩展使智能体从简单的聊天机器人升级为能处理多步骤复杂任务的智能执行体

2025-12-03 08:26:19 778

原创 秒懂神经网络:给零基础的你,一篇就够!

本质:受大脑启发,用于处理信息的数学模型。结构:输入层、隐藏层、输出层组成的流水线。单元:神经元通过加权求和和激活函数进行工作。学习:通过前向传播计算损失反向传播三步循环,自动调整参数,从数据中学习。希望这篇“极简指南”能帮你拨开迷雾,对神经网络建立一个直观而清晰的认识。它不再是遥不可及的“黑科技”,而是一个设计精巧、功能强大的工具。如果你对某个部分特别感兴趣,或者有不明白的地方,欢迎在评论区留言讨论!

2025-12-02 12:04:38 676

原创 【LangChain_V1.0从入门到实践】第6章 中间件(middleware)

LangChain 1.0中间件系统是一个可插拔的拦截器架构,允许开发者在智能体执行流程中注入自定义逻辑。该系统提供两类核心钩子:节点式钩子(如@before_model)在特定执行点触发,用于日志记录、权限检查等;包裹式钩子(如@wrap_model_call)拦截整个调用过程,支持实现重试、缓存等复杂逻辑。中间件按照注册顺序形成执行管道,支持修改输入输出、添加监控等功能,是构建生产级AI应用的关键特性。通过装饰器模式可快速实现轻量级中间件,如日志记录或模型调用重试机制。

2025-12-02 11:25:07 1491 2

原创 【LangChain_V1.0从入门到实践】第5章 工具(Tools)

摘要:本文介绍了在LangChain 1.0中创建工具的三种主要方法及其适用场景。通过@tool装饰器可快速将简单函数转换为工具;StructuredTool.from_function提供更灵活的配置选项;继承BaseTool类则支持完全自定义复杂工具。文章还详细说明了如何定义复杂的输入模式,包括使用Pydantic模型和JSON模式进行参数验证和描述,帮助开发者根据需求选择最适合的工具创建方式。

2025-12-01 08:42:31 1030

原创 【LangChain_V1.0从入门到实践】第4章 模型(Models)

LangChain 1.0提供了灵活的模型调用方式,支持多种初始化方法(子类直接初始化或统一init_chat_model函数)。核心功能包括基础调用(invoke)、流式输出(stream)和批量处理(batch),并支持工具绑定(bind_tools)和结构化输出(with_structured_output)。在智能体应用中,模型可作为推理引擎,通过create_agent创建代理,并支持值流和消息流两种输出模式观察决策过程。这些功能使开发者能高效构建AI应用,实现复杂任务处理和实时交互。

2025-12-01 08:34:00 306

原创 深度学习的技术路线:从入门到专家全方位指南

深度学习的技术路线既充满挑战,又极具吸引力。随着技术的不断发展,深度学习正在成为推动人工智能全面赋能各行各业的核心力量。掌握深度学习技术,不仅有助于我们在AI时代保持竞争力,更能让我们更好地理解正在发生的技术变革。深度学习的发展如同“轻舟已过万重山”,正在加速拓展人类的脑力劳动能力,推动生产力实现又一次质的飞跃。

2025-11-29 15:31:47 694

原创 一文读懂:机器学习、深度学习、大模型三者关系,终于有人讲明白了!

摘要: 本文系统梳理了人工智能(AI)技术中的核心概念层级关系:AI是总体学科,机器学习是其核心方法论,深度学习是机器学习的先进分支,而大模型则是深度学习的超大规模实践。文章指出,传统机器学习依赖人工特征提取,深度学习能自动学习特征,大模型则通过海量参数和数据展现"涌现能力",实现通用AI。技术选择应匹配业务需求,大模型适合通用任务,传统机器学习在资源有限时更具优势。理解这些概念的演进关系,对把握AI技术本质和发展趋势至关重要。

2025-11-29 15:24:01 853

原创 经济下行,内卷加剧:AI如何成为你自我突破的“破局之钥”?

经济下行和内卷加剧的环境确实带来挑战,但也迫使个人重新思考职业发展路径,寻找新的突破点。AI技术作为这个时代最具变革性的力量,为个人突破提供了强大助力。关键在于,我们应当主动拥抱这一变化,将AI从潜在的“替代者”转变为个人成长的“助力者”。通过有效利用AI提升能力、优化工作、强化独特性,我们不仅能够应对当下的经济挑战,还能够在AI时代开辟一条独特的职业发展道路。真正的突破始于思维转变,成于持续行动。现在,就是开始的最佳时机。

2025-11-28 08:57:45 1085

原创 Java开发者转型AI大模型应用开发:一条从LangChain到自建模型的务实路径

Java开发者转型AI大模型应用开发,不应放弃已有优势,而应将工程思维与AI技术结合。这条从LangChain到底层模型开发的路径,让转型风险可控、成果可见。资源提示:本文涉及的代码示例和详细教程,可在LangChain4j官方文档和Hugging Face课程中找到。对于希望系统学习的开发者,吴恩达的《深度学习专项课程》和《动手学深度学习》是不错的起点。转型不是替代,而是扩展。Java开发者的工程能力在AI时代将更加珍贵,现在就是开始行动的最佳时机。

2025-11-28 08:39:33 816

原创 工程思维决胜AI时代:Java开发者的稀缺价值与新赛道

摘要: AI时代下,Java开发者的工程化思维成为稀缺资源。研究表明,多数AI项目失败源于工程化缺陷(如稳定性、扩展性),而非算法本身。Java开发者凭借系统架构经验,能高效解决大模型落地的并发、集成等难题,其价值在AI生产化阶段凸显。转型关键是从“功能实现”转向“智能服务设计”,结合Spring AI等工具实现差异化竞争。未来,兼具传统系统经验与AI集成能力的Java架构师将主导技术团队,薪资涨幅可达70%。技术变革重构分工,工程思维仍是AI落地的核心优势。

2025-11-27 15:40:24 634

原创 【LangChain_V1.0从入门到实践】第3章 消息Message

本文介绍了LangChain中的消息系统及其应用。消息(Message)是与LLM交互的基本单元,分为4种类型:SystemMessage(系统指令)、HumanMessage(用户输入)、AIMessage(模型响应)和ToolMessage(工具调用结果)。文章详细讲解了消息的两种主要使用方式:文本提示(适合简单任务)和消息提示(适合多轮对话),并比较了四种消息构建方法的优缺点,推荐生产环境使用完整模式以确保类型安全。最后展示了各类消息的具体用法,包括系统消息设定、用户消息传递和AI响应处理

2025-11-27 15:06:33 1032

原创 【LangChain_V1.0从入门到实践】第2章 Hello,Agent

本文介绍了基于macOS系统的LangChain开发环境搭建与基础使用。首先详细说明了Python 3.13、Anaconda、Ollama和PyCharm的安装步骤,并配置了华为云国内镜像源。接着创建了包含LangChain核心包的Conda环境,对比了本地模型(Ollama)与外部API交互的优缺点。通过"hello ollama"示例演示了两种调用方式:传统方式使用ChatOllama类直接调用,以及推荐的LangChain标准化方式使用init_chat_model函数。文章还提

2025-11-26 08:57:39 1311

原创 【LangChain_V1.0从入门到实战】第1章 LangChain简介

大模型(Large Language Model, LLM)是指具有超大规模参数(通常达数十亿至数万亿)、复杂计算结构的机器学习模型。它通过海量多模态数据(如文本、图像、音频)进行预训练,能够处理通用任务,并展现出强大的语言理解、生成和推理能力。例如,GPT系列模型的参数规模可达千亿级,训练数据量相当于数百万本书籍的文本。

2025-11-25 15:36:39 790

原创 flink源码分析-flink-yarn-session共享模式下job提交流程分析

前言之前的文章中已对flink-yarn-session的独立模式下job的提交流程进行了分析,今天在此基础上,对flink-yarn-session的共享模式下job提交流程进行分析。flink-yarn-seesion共享模式job提交流程分析前面文章中已经介绍了flink-yarn-session的独立模式与共享模式出现的分支节点在org.apache.flink.client....

2020-05-05 23:25:42 1961 1

原创 flink源码分析-flink-yarn-session job独立部署模式的任务提交流程

flink(版本1.9.0)源码分析,从源码的角度来分析flink per job on yarn的job提交流程,品读源码的原滋原味

2020-05-03 15:05:10 2131

原创 flink per job on yarn 找不到或无法加载主类org.apache.flink.yarn.entrypoint.YarnJobClusterEntrypoint

flink 独立模式部署到yarn上出现以下问题问题:找不到或无法加载主类 org.apache.flink.yarn.entrypoint.YarnJobClusterEntrypoint

2020-04-22 21:29:53 7760 12

原创 leetcode滑动窗口最大值的意外收获

对于问题的具体描述可以查看https://leetcode-cn.com/problems/sliding-window-maximum/下面是我的方案代码: /** * 思路: * 1,首先,计算出第一个窗口的最大值windowMaxVal以及最大值对应的下标windowMaxIndex; * 2,第二步,数组从i(i初始值为k)下标开始遍历数组: ...

2020-04-19 10:04:18 335

原创 java性能优化总结(1):基础篇

从走上工作岗位到现在已经有5年多了,在java的技术道路上也走了这么久了,自己也该好好总结一下。总结的过程也是梳理自己所掌握知识体系的过程。本篇博客适合有一定java基础的人观看。下面咱们就开始吧。 对象对象,大家都知道java是面向对象的语言。在java中对象是如何创建的呢?在java中对象的创建方式有以下5种方式:通过new关键词在堆中产生对象通过Clone()方法创建对象通过字节流

2016-12-29 19:24:19 490

原创 Java NIO

[topic] 初探Java NIO以前只是听说过,没有进行深入学习,昨天趁着周末时间学习一下,今天来总结作为学习java NIO的备忘录吧。java NIO的全程是java New IO,这里涉及到IO,此时在我们脑海想回到IO,这个IO与之前的IO有什么不同才会体现New特性呢?我将从三个方面来探讨IO与NIO的区别。 第一、之前的IO是一种面向流式的数据操作,而NIO是面向数据缓冲的操

2016-12-11 17:18:06 385

原创 技术负责人如何带领好团队

“如何管理好团队?”当一个朋友将这个问题抛给我的时候,我竟不知道该如何去阐述。虽然带过团队,却从来没有去总结一下,脑子里信息十分零散。经过反复思考并结合自己的工作经历,我从7个方面阐述个人之见解。第一、  管理向服务的思想观念转变如何管理好团队,如果一个团队需要人去管理的话,那么这个团队不是一个很好的团队。作为一个团队的负责人不应该从管理者的角度去考虑这个问题,而是应该从服务者的角度去思考

2016-10-11 08:02:02 6584 1

原创 管理者如何去管理自我

昨天与同事们一起分享和探讨了《人件》这本书。《人件》这本书主要体现了项目管理中以人为本的思想。《人件》这本书有些思想个人觉得有点太理想化了。这本书是从领导者角度如何去管理项目团队成员并以项目团队成员为核心。今天我给大家分享一下德鲁克的《卓有成效的管理者》。这本书不是去管理他人,而是转变观念如何管理自己。《卓有成效的管理者》强调管理者的工作必须具有有效性。管理者也必须学会使自己的工作有效性。

2016-01-06 16:03:19 655

原创 《人件》读后感

最近趁着元旦假期重新阅读了《人件》这本书。之前虽然读了一遍,但是只是草草的读了一遍。最近公司领导想让我给大家讲讲这本书的内容,所以又“逼”我再次读了一遍并使用思维导图做了些总结。人们认识事物总是习惯使用由表及里的思维方式。首先让我们认识一下这本书的书名《人件》。我第一次读这本书的时候,一看到这个书名“人件”?“人贱”?就感到疑惑。

2016-01-06 09:52:17 1896

原创 oracle 分割字符串方法以及关联数组与bulk into的使用

create or replacePROCEDURE PRO_TEST AS//声明一个关联数组类型TYPE myarryId is TABLE OF varchar2(20) index by PLS_INTEGER;//定义关联数组变量myarr myarryId;//定义数组的下标变量myIndex PLS_INTEGER;BEGIN select re...

2014-02-21 18:00:19 335

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除