- 博客(2465)
- 收藏
- 关注
原创 面试官问:Agent的记忆模块是怎么实现的?
记忆模块的核心价值: 让模型具备“长期状态感”,从短期问答进化为真正的 Agent。两类核心机制: 短期记忆保上下文一致性,长期记忆保知识持续性。实现关键: 存储(Vector Store)+ 检索(Retrieval)+ 更新(Summarize)。工程取舍: 灵活与效率、容量与可控之间永远是平衡问题。面试启发: 会讲原理没用,能解释“为什么这样设计”才显得懂工程。
2025-11-22 21:48:16
688
原创 转行了:从程序员到大模型工程师,我的心路历程
从程序员到大模型工程师,是一场“破圈”之旅。它需要你跳出舒适区,用归零的心态重新学习,更需要你用强大的动手能力将理论付诸实践。这条路很卷,也很辛苦,但沿途的风景和最终的视野,绝对值得你为之奋斗。如果你也心动了,那么,现在就开始吧。
2025-11-22 21:47:06
765
原创 程序员转行能做什么工作?不用焦虑了!
当传统CRUD开发逐渐被AI代码生成取代,大模型全栈工程师正成为新一代技术话语权的掌控者。腾讯混元实验室负责人直言:_“未来三年,不懂LLM的程序员将面临降维打击”_2。转型不是选择题,而是生存战。无论你是:苦于内卷的Java老手 → 用LangChain重铸后端价值迷茫的前端开发者 → 成为AI交互设计先锋数据管道工程师 → 转型向量索引架构师。
2025-11-21 18:08:40
1083
原创 双非二本科生搞大模型应用开发(rag,agent)能找到工作吗,有钱途吗?
做向量的RAG肯定找不到工作,不为什么,就是过时了,Agent?那是人工智能编程的事。不是套模板……如果你能把RAG+Agent结合,那肯定能找到工作!如何不用向量数据库也能做RAG?而是要用Agentic方法搞定了百万token文档检索……这大把公司要的,因为你都能自己出来单干了!!!!就说我之前调试一个法律文档检索系统。客户的合同有800多页,切记800多页!传统RAG的向量检索总是找不到关键条款——明明就在第523页的免责条款里,FAISS就是检索不出来。搞了半天才发现,是文档分块把一个完整的条款切成
2025-11-18 18:40:35
693
原创 程序员如何转行到ai大模型领域?
想深入搞懂模型本身,我强烈建议去刷一遍李宏毅老师的生成式AI课程,讲得非常系统和深入,特别是对模型内部的原理,比很多蜻蜓点水的课强太多。另外,有个中国人组成的研究小组,他们整理的大模型文档在外网都火了,内容非常扎实,适合我们中国人自己的学习习惯。这就好比造发动机,全世界能造顶级航空发动机的公司就那么几家,但并不妨碍全世界有无数家车企、无人机公司、甚至割草机公司,靠着这些发动机,做出千姿百态、利润丰厚的生意。结合你程序员+算法的背景,转行的路子,我把它粗暴地分成三个方向,你可以对号入座,看看哪个更适合你。
2025-11-18 18:21:34
975
原创 目前最全,188+26个国产大模型!
文章介绍了国内通过国家级备案的188家AI大模型和地方登记的26家大模型,详细分析了百度文心一言、科大讯飞星火等10个主流大模型的特点、优缺点及应用场景,并探讨了大模型在金融、医疗等行业的落地现状、优势、挑战及发展前景,提供了完整清单下载链接,为开发者全面了解国内大模型资源提供实用参考。Minimax的ABAB大模型:Minimax凭借自研实力,推出了包含多个模态(如文本到视觉、文本到语音、文本到文本)的基础模型架构,并成功推出了自研通用大模型“ABAB”,展现了其在多模态处理方面的潜力。
2025-11-17 18:26:12
911
原创 Cursor+MCP金融分析Agent
在这里插入图片描述](https://i-blog.csdnimg.cn/img_convert/47b2870f05d321db73b2001083c1e328.png)!从原理出发真正入局大模型。**从基础的 prompt 工程入手,逐步深入到 Agents,其中更是详细介绍了 LLM 最重要的编程框架 LangChain。
2025-11-14 12:19:40
107
原创 写给大模型新人的经验,刷到少走三年弯路!
不过这里我不禁要给各位泼一点冷水,在 AI 算法这个行业,三是很吃业务经验的,如果你之前本身就是做算法的,比如是做 NLP,又或者是做语音助手,对话机器人这类的,再顺水推舟做相关方向的大模型算法工程师,这是比较合适的。拿数据来说,先说通用的大模型训练,数据的来源,从哪里采,数据的质量怎么把控,如何过滤有毒信息,语言的筛选与比例,数据的去重,以及数据的规范化处理,评测集的构建。对于垂直领域,比如金融,电商,法律,车企,这种领域数据的构建就更考验技术了,业务数据怎么来,数据不够怎么办,完全没有数据怎么办?
2025-11-13 18:59:24
1008
原创 面试官问:RAG的检索模块是怎么优化的?
面试时可以这样回答:向量化:使用统一Embedding模型;混合检索:结合Dense与BM25,兼顾语义与精确;精排模型:用Cross-Encoder做Rerank;缓存与元数据过滤:提升速度与结果可靠性。我在项目中通过Hybrid Search + Reranker的方式,将检索准确率提升了20%以上。这样的答法逻辑完整,又有实操感,面试官很难不满意。检索优化看似是算法问题,但本质上是工程平衡——速度、准确率、成本的取舍。最好的系统从来不是“最复杂”的,而是在正确的地方做取舍。
2025-11-12 18:30:53
583
原创 AI实战篇:用LangGraph串联RAG+MCP打造能理解、会思考的Jira智能体
除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。架构核心思想:LangGraph作为“大脑”,协调各个“专业工具人”(Tools)来完成复杂任务, 这里RAG作为知识库, 就是个“大仓库” 或者“口袋”, 下面的地盘或者叫“底座”是个LLM(大语言模型)。大家好,我是AI学习的杨同学,一个在AI技术领域持续深耕的老司机。
2025-11-12 18:25:22
1034
原创 如何构建企业级数据智能体:Data Agent 开发实践
用户经常会问使用Data Agent做数据分析,模型有上下文窗口限制,是怎么放得下的, 我们通常回答放不下,因为Data Agent并不会把用户的原始数据给到模型上下文, 根本原因不是上下文窗口问题,而是模型推理的本质, 虽然今天像Qwen,DeepSeek这类模型具备Thinking模式,模型进行依然是语义空间的模式匹配和概率推理,对于精确的数值计算,逻辑推导,模型本质是在模拟计算过程,而非真正执行计算。Data Agent 经过小半年的建设,其分析能力已经得到客户的认可,并在云栖大会上,备受关注。
2025-11-11 18:58:29
1260
原创 基于Spring AI Alibaba 的 DeepRese
项目的动态报告生成与导出功能,通过将核心业务逻辑(报告管理、格式转换)与 API 接口解耦,构建了一个清晰、可扩展的模块。它不仅提供了多样的导出选项以满足不同用户的需求,还通过集成开源的第三方库(commonmark和)确保了高质量的文档输出。同时,通过提供Redis和内存两种存储实现,并利用 Spring Boot 的条件化配置自动切换,兼顾了生产环境的可靠性和开发测试的便捷性。这套功能极大地提升了用户使用的便利性和交互体验,是整个应用闭环中不可或缺的重要一环。四、使用方式与部署方式。
2025-11-11 18:57:11
682
原创 别再埋头“猜”需求了!让真正懂业务的AI智能体来帮你
测试用例智能体是一种基于大语言模型(LLM)的测试自动化辅助系统。它能自动读取并理解需求文档、用户故事或接口定义,进而自动生成符合业务逻辑的测试场景、测试步骤和预期结果。从本质上讲,它是将测试工程师的分析与设计能力进行“知识化建模”,并由大语言模型自动执行的智能代理。需求语义理解:自动提取业务逻辑、系统功能、输入输出条件;测试场景生成:基于需求语义生成正向、反向、边界等测试场景;测试用例生成与优化:自动输出标准化测试步骤和预期结果;数据自动化生成与管理:识别可变参数并自动生成测试数据;
2025-11-11 18:56:24
512
原创 为什么我还是无法理解transformer?
(这个会在Decoder中详解)。Decoder部分和Encoder类似,但它是自回归模型,它的输入就是它是输出,你可能好奇,那第一个字符是啥?——当然是空的了,是个空的Token [S](输出的来源自然来自Encoder部分的输入,需要仔细理解),你得等Decoder的第一个字符输出了,才能灌回Decoder的输入,可以看到,Transformer框架图里的Decoder输入注释成(shifted right),非常形象。
2025-11-10 19:43:05
829
原创 在目前的大环境下,普通人的出路在哪里?
除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。为了帮助大家打破壁垒,快速了解大模型核心技术原理,学习相关大模型技术。教程从当下的市场现状和趋势出发,分析各个岗位人才需求,带你充分了解自身情况,get 到适合自己的 AI 大模型入门学习路线。卖不出去的房子是债,不匹配的青年就业是债,人口结构是债,鼓励民企参与基建的社会化融资也是债。
2025-11-10 19:42:18
902
原创 35岁,转行AI正是黄金期!大模型领域机会、学习路径全解析,程序员小白都适用
只要找准定位、敢于行动,中年亦可成为AI浪潮的“弄潮儿”。正如一位成功转型者所说:“
2025-11-08 22:06:35
1316
原创 3分钟让你知道什么是LangChain,以及LangChain的部署配置全流程
LangChain 是一个为各种大型语言模型应用提供通用接口的框架,旨在简化应用程序的开发流程。通过 LangChain,开发者可以轻松构建如图所示的 RAG(Retrieval-Augmented Generation)应用。在这里插入图片描述LangChain 是一个专为构建大型语言模型(LLMs)驱动的应用程序而设计的框架,其核心目标是简化从开发到生产的整个应用程序生命周期。
2025-11-06 14:42:30
1046
原创 28岁的程序员,目前考虑转行,但又不知道自己能干什么_转行做什么
身体受不住,如有一些慢性病,或是腰椎、坐椎有痛处的,还有其他身体警告信号的,这时已经是不好的节奏了,做技术开发,持续加班肯定避免不了的,在哪个公司都一样,你能能坐的住,熬得住。LZ今年28岁了,毕业于一个普通的二本院校,工科男,学的是计算机科学与技术,做了三年的软件应用开发,现在做Android开发,越来越感觉到力不从心,很多技术需要从头学起,压力太大,自己没有太多的天赋学习,做开发感觉不是非常得心应手,也没有能力坐上管理的岗位,感觉做程序员迟早是要转行的,不如越早越好,时间成本没那么大。
2025-11-06 14:40:17
803
原创 Transformer训练过程、推理过程详解
Transformer是一种很重要且强大的模型,如今网上介绍Transformer的文章很多,但是大都是只是介绍模型的结构,对于训练过程、推理过程模型的输入和输出都没有进行介绍,使人看的一头雾水,因为本文就Transformer的模型的训练和推理过程进行详细的介绍。
2025-11-06 14:38:10
1070
原创 【Transformer模型学习】第一篇:提出背景、模型架构及推理过程
按照国际惯例,首先声明:本文只是我自己学习的理解,虽然参考了他人的宝贵见解及成果,但是内容可能存在不准确的地方。如果发现文中错误,希望批评指正,共同进步。这篇论文(以后称为“原文”)提出了一种新的神经网络架构——,它完全基于注意力机制,摒弃了传统的循环神经网络(RNN)和卷积神经网络(CNN)。第一篇:提出背景、模型架构及推理过程(本篇)第二篇:多头注意力机制第三篇:位置编码。
2025-11-06 14:37:00
606
原创 一文看懂 LangChain:为什么火?核心模块都干啥?
LangChain = 「Prompt + 模型 + 工具 + 记忆 + 检索」的组件化框架,用来构建多轮对话、文档问答、Agent 应用的乐高积木库。可能大家都想学习AI大模型技术,也_想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习_,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了帮助大家打破壁垒,快速了解大模型核心技术原理,学习相关大模型技术。从原理出发真正入局大模型。在这里我和MoPaaS魔泊云联合梳理打造了系统大模型学习脉络,这份。
2025-11-04 15:18:03
728
原创 AI大模型学习路线(非常详细)收藏这一篇就够了!
自学AI大模型需要扎实的基础知识、系统的学习路线和持续的实践与探索。希望这条学习路线能为新手小白们提供一个清晰的方向,帮助大家更好地进入和发展在AI大模型领域。祝大家学习顺利,早日成为AI领域的专家!可能大家都想学习AI大模型技术,也_想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习_,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了帮助大家打破壁垒,快速了解大模型核心技术原理,学习相关大模型技术。从原理出发真正入局大模型。
2025-11-04 15:15:58
908
原创 【AI大模型】一文讲清多模态RAG,零基础小白收藏这一篇就够了
当下,⼈⼯智能市场迎来了爆发期,并逐渐进⼊以⼈⼯通⽤智能(AGI)为主导的新时代。企业纷纷官宣“ AI+ ”战略,为新兴技术⼈才创造丰富的就业机会,⼈才缺⼝将达 400 万!DeepSeek问世以来,生成式AI和大模型技术爆发式增长,让很多岗位重新成了炙手可热的新星,岗位薪资远超很多后端岗位,在程序员中稳居前列。与此同时AI与各行各业深度融合,飞速发展,成为炙手可热的新风口,企业非常需要了解AI、懂AI、会用AI的员工,纷纷开出高薪招聘AI大模型相关岗位。可能大家都想学习AI大模型技术,也_
2025-11-04 15:15:11
787
原创 一文读懂什么是RAG,如何搭建多模态RAG降低大模型幻觉?
当我们向 LLM 提出超出其预训练知识范围的问题时,通常 LLM 会出现幻觉。例如,如果我们向 LLM 提出涉及医学或法律等高度专业化的问题,并包含大量内部术语时,我们就有可能得到 LLM 随机生成的不准确的回答。缓解这一问题的一种方法是使用特定的数据集对 LLM 进行微调。虽然这种方法很有效,但十分耗时且高成本,需要消耗的内存也非常高。RAG 是另一种基于信息检索方法,可以缓解 LLM 幻觉。我们首先获取用户的查询,然后在我们的数据库中找到最相关的上下文,这些上下文可以帮助 LLM 生成准确的回答。
2025-11-04 15:14:17
577
原创 最简明的大模型agent教程
大模型Agent是结合了大规模神经网络模型和自主计算实体的技术,它具备强大的表达、学习和交互能力,能够在无人干预的情况下,根据环境信息自主决策和控制行为。简单而言之,agent是增强大模型能力的技术方案路径。主要包括:工具、工具选择方案,大模型工具应用3个部分。1用户给出一个任务(Prompt) -> 2思考(Thought) -> 3行动(Action) -> 4观察(Observation)
2025-10-31 12:43:22
743
原创 3分钟让你知道什么是LangChain,以及LangChain
LangChain 是一个为各种大型语言模型应用提供通用接口的框架,旨在简化应用程序的开发流程。通过 LangChain,开发者可以轻松构建如图所示的 RAG(Retrieval-Augmented Generation)应用。在这里插入图片描述LangChain 是一个专为构建大型语言模型(LLMs)驱动的应用程序而设计的框架,其核心目标是简化从开发到生产的整个应用程序生命周期。
2025-10-31 12:42:31
791
原创 AI产品经理入门到精通,收藏这一篇就够了!转行AI产品经理,零基础也能轻松入门教程(非常详细)_产品经理ai
除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。为了帮助大家打破壁垒,快速了解大模型核心技术原理,学习相关大模型技术。百度搜索、腾讯广点通、抖音的个性化推荐,底层逻辑都是运用AI完成个性化搜索、推荐,刺激你“上瘾”,爱上使用这些app产品。这其实就是,AI算法根据平日习惯“预判了你的预判”,给了你“独一无二”的推荐,让你下意识去点开。
2025-10-29 17:14:34
827
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅