自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1289)
  • 收藏
  • 关注

原创 当红炸子鸡LoRA,是当代微调LLMs的正确姿势?

自 ChatGPT 掀起了大模型(LLM)风潮后,一大波 LLMs(GPT-4, LLaMa, BLOOM, Alpaca, Vicuna, MPT …) 百花齐放。知识问答、文章撰写、代码编写和纠错、报告策划等等,它们都会,也能够交互式地和你玩文字游戏,甚至还有些很有才的朋友将 LLM 作为交互的接口,同时连接到其它各种模态(e.g. 视觉 & 语音)的模型,从而创造了炸裂的多模态效果,炫~!这么炫,难免人人都想打造一个自己专属的 LLM(怎么有种回到了小时候玩宠物驯养游戏的赶脚…)。

2025-12-01 18:40:56 869

原创 面试官问:Agent_的记忆模块是怎么实现的?

记忆模块的核心价值: 让模型具备“长期状态感”,从短期问答进化为真正的 Agent。两类核心机制: 短期记忆保上下文一致性,长期记忆保知识持续性。实现关键: 存储(Vector Store)+ 检索(Retrieval)+ 更新(Summarize)。工程取舍: 灵活与效率、容量与可控之间永远是平衡问题。面试启发: 会讲原理没用,能解释“为什么这样设计”才显得懂工程。

2025-12-01 18:39:25 729

原创 一文搞懂MCP、Function_Calling和A2A

单纯的大模型,只能对话和生成文本,是“思想的巨人,行动的矮子”。配上Agent的大模型,能感知环境、使用工具、执行任务,成为“万能助手”。MCP、Function Calling 和 A2A。这三项技术,并不是有你无我的排斥关系,而是可以通力协作的互补关系。大模型通过 Prompt 学习工具使用,实现非结构化任务处理,克服传统规则的“刚性”,使得AGI(Artificial General Intelligence,通用人工智能)成为可能。

2025-12-01 18:36:51 1006

原创 写给想做大模型算法的你

同时课程详细介绍了。

2025-12-01 18:35:29 863

原创 程序员转行AI大模型必备教程:从入门到精通,手把手告诉你我是怎如何从零基础到高薪就业的

在人工智能(AI)迅速发展的背景下,从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说,这也是一个实现职业转型、提升薪资待遇的绝佳机遇。一、明确大模型概念简单来说,大模型就是具有大量参数和强大计算能力的人工智能模型,可以处理各种复杂的任务,如自然语言处理、图像识别等。想象一下,大模型就像是一个超级聪明的大脑,能够理解和处理各种信息。二、转行步骤第一步:学习基础知识。了解机器学习、深度学习的基本概念和原理,掌握常见的算法和模型架构。

2025-11-26 16:09:24 813

原创 薪资翻倍!普通程序员是如何成功转行大模型?

嘿,各位程序员小伙伴们!大家都知道现在大模型可火了,好多人成功转了行,薪资还直接翻倍,那咱普通程序员能不能也这么牛呢?当然能!首先呢,得把基础知识打牢。啥是机器学习、深度学习,这些都得整明白。可以去网上找些好的课程学学,或者买几本靠谱的书看看。这就像是盖房子得先打地基,基础好了,后面才稳。然后就是多动手实践。找些开源项目跟着做,或者自己试着弄个小模型玩玩。别怕犯错,在实践中才能真正学会那些技术。就像学骑自行车,光看别人骑不行,自己得上去试试。可不能两耳不闻窗外事哦,得时刻关注行业动态。

2025-11-26 16:06:01 562

原创 程序员转行AI大模型教程(非常详细),后端开发转行大模型应用

在人工智能(AI)迅速发展的背景下,从传统的编程领域如Java程序员转向大模型开发是一个既充满挑战也充满机遇的过程。对于 Java 程序员来说,这也是一个实现职业转型、提升薪资待遇的绝佳机遇。前排提示,文末有大模型AGI-优快云独家资料包哦!一、明确大模型概念简单来说,大模型就是具有大量参数和强大计算能力的人工智能模型,可以处理各种复杂的任务,如自然语言处理、图像识别等。想象一下,大模型就像是一个超级聪明的大脑,能够理解和处理各种信息。二、转行步骤第一步:学习基础知识。

2025-11-26 16:04:47 682

原创 2025年零基础转行大模型产品经理必备:从入门到精通全攻略,6个月实现月薪30K+的跃迁之路

同时课程详细介绍了。

2025-11-26 16:02:25 966

原创 2025年最新!后端程序员转行AI大模型学习路线,大模型入门

本文为后端程序员提供AI大模型转型完整学习路径,分基础筑基(1-2月)、核心技能突破(2-3月)和高阶拓展(3-6月)三阶段,涵盖Python强化、RAG系统、Agent开发、提示工程及微调部署等关键技术。文章强调工程化实战,从原型到企业级应用的架构设计,并提供职业发展建议和持续学习方向,助力后端工程师转型AI应用开发,实现薪资提升和职业跃迁。1.1 工程能力的降维打击后端程序员固有的系统架构设计、高并发处理及运维部署经验可直接迁移至AI应用开发:1.2 工具链的快速适配后端开发者的技术栈与大模型开发工

2025-11-26 15:59:33 574

原创 大模型微调训练实践

LoRA(Low-Rank Adaptation)是一种参数高效的微调方法。它的核心思想很简单:冻结原模型参数,只训练额外的小参数矩阵来调整模型输出创建数据处理脚本import os"""处理自我认知数据,替换占位符Args:row: 数据行name: 模型名称 [中文名, 英文名]author: 作者名称 [中文名, 英文名]"""continue# 根据语言标签选择中文或英文continue# 替换占位符return row"""处理自我认知数据集"""

2025-11-22 22:14:05 688

原创 什么是技术架构、数据架构、业务架构、应用架构、产品架构和项目

文章指出项目推进困难的根源在于架构认知缺失,系统梳理了六大核心架构:业务架构、数据架构、应用架构、技术架构、产品架构和项目架构。这些架构构成了一个严谨的决策链条,从定义战略价值到组织人类智慧完成构建,彼此约束又相互滋养。成功的数字化系统需要这六大视角动态平衡、协同演进,帮助各部门有效协作,提高项目可行性和效率。技术团队开发的功能业务方总说不适用;系统随着业务发展变得臃肿难维护;跨部门协作时各说各话,推进困难。这些问题看似毫无关联,但它们都指向同一个根源:对架构认知的片面与缺失。有了对架构的认知,各部门之间就

2025-11-22 22:12:09 846

原创 面试官狂问的28个RAG问题全解析:从基础到架构优化

RAG,全称 Retrieval-Augmented Generation,是一种结合“外部知识检索”和“大语言模型生成”的混合架构。它先从知识库中检索相关文档,再让模型基于这些文档生成回答。

2025-11-22 22:11:05 689

原创 大龄程序员想转行大模型,应该往哪个方向转?_程序员中年失业后,如何选择方向,大模型算法

每个方向都有其独特的挑战和发展机遇,程序员可以根据自己的背景和兴趣选择最适合自己的路径。无论选择哪个方向,持续学习最新的技术和保持对行业的敏感度都是非常重要的。此外,积极参与社区活动、贡献开源项目也是提升技能和个人影响力的有效方式。在大模型时代,我们如何有效的去学习大模型?如果你也想系统学习AI大模型技术,想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习*_,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。

2025-11-21 18:39:19 1393

原创 程序员如何转行大模型?五大热门岗位推荐,IT行业最后的风口就在大模型!错过就难有下次了!

同时课程详细介绍了。

2025-11-21 18:38:11 290

原创 35岁,转行AI正是黄金期!大模型领域机会、学习路径全解析,程序员小白都适用

只要找准定位、敢于行动,中年亦可成为AI浪潮的“弄潮儿”。正如一位成功转型者所说:“

2025-11-18 18:45:35 671

原创 大模型AI Infra方向面试会有哪些经常提问的问题?

同时课程详细介绍了。

2025-11-18 18:33:24 473

原创 激荡三十年:推荐系统从协同过滤到大模型时代

2006-2015年是推荐系统的黄金十年。Netflix Prize将推荐系统推向了学术和工业界的前沿,矩阵分解、隐式反馈、特征工程等技术成为业界标准。这一时期的成果为后续深度学习时代奠定了坚实基础——许多核心思想(如Embedding、特征交互、多目标优化)在深度学习模型中得到了延续和发展。同时,这一时期也暴露了传统方法的局限:手工特征工程费时费力、模型表达能力有限、难以处理高维稀疏数据等。这些问题呼唤着新的技术范式,而答案即将在深度学习时代揭晓。

2025-11-18 18:32:23 468

原创 【AI开源】2B参数多模态大模型Open-Qwen2VL:220小时训练,性能超越闭源,完整开源方案

通过实验证明,基于高效多模态大模型(MLLM)的高质量数据过滤技术和精心设计的数据混合策略,能够在计算资源有限的条件下实现高效预训练,从而开发出具有竞争力的多模态大模型。通过采用多模态序列打包技术和基于平均池化层的动态图像标记数调整,进一步提升了预训练效率。最终开发的Open - Qwen2VL模型在多个多模态基准测试中超越了部分开源的Qwen2 - VL - 2B模型,而其预训练令牌仅为Qwen2VL的0.36%。

2025-11-18 18:31:11 396

原创 2025年了转码,或者转算法工程师还有可行性吗?

*另一个是浙大化工,干了两年工厂,辞职在家自学一年,现在在一家工业AI初创做预测性维护模型的开发,听他说最近刚拿到期权。这点我特别有体会,我有个朋友在做锂电池厂的智能质检,原来也是材料出身,后来转搞图像识别,用AI检测电芯缺陷,现在在一个工业AI公司,年薪比他以前高一倍多,最关键是他说:“我做的东西终于能在工厂落地了,感觉特踏实。说句残酷点的,哪怕你学了一年,最后没进top大厂,但你掌握了算法开发能力、会模型训练和调参**,能独立做小项目,就已经是市面上很多初创公司、工业智能平台在找的人了。

2025-11-18 18:29:51 330

原创 详解Github_35K+项目:打通200+数据源,构建企业

这里把“files”这个数据库中的sales_*questions文件“表”与my_*emb_*openai这个模型”表“进行JOIN,Mindsdb会自动发现两者匹配的”字段“content,并生成向量,然后直接在“my_*chromadb"这个库中创建向量”表“(注意字段名称是强制的),这样就完成了一个向量索引的过程!可以看到,不管底层使用的是自训练ML模型还是外部的LLM,MindsDB都将其统一为SQL可查询的表接口,实现了模型与数据的无缝融合。但不同的是,这里全部是用SQL完成的。

2025-11-17 18:46:28 476

原创 扣子(Coze)实战:篇篇10W+的小林漫画,用Coze实现

同时课程详细介绍了。

2025-11-12 18:56:59 913

原创 新项目完结,Ai Agent智能体、拖拉拽编排!

同时课程详细介绍了。

2025-11-12 18:55:26 878

原创 面试官问:RAG的Query理解模块是怎么做的?

很多人以为RAG的核心是检索或生成, 但真正决定系统表现的,往往是Query 理解的能力。理解得好,后面的检索就像打靶——稳、准、狠。理解得差,模型再强也答不对。“RAG的智能,不在模型,而在解析。在过去的几个月中,我们已经有超过80个同学(战绩可查)反馈拿到了心仪的offer,包含腾讯、阿里、字节、华为、快手、智谱、月之暗面、minimax、小红书等各家大厂以及传统开发/0基础转行的同学在短时间内拿到了各类大中小厂的offer。如果你近期准备转向大模型。

2025-11-12 18:52:16 781

原创 动手学Agent:工具使用(5)MCP工具调用

同时课程详细介绍了。

2025-11-12 18:50:59 387

原创 ReAct范式深度解析:从理论到LangGraph实践

LangGraph是LangChain团队开发的用于构建AI Agent的框架。它的思想是:将AI Agent的执行过程抽象为一个有向图。LangGraph的核心特性:1.图结构:将AI逻辑抽象为节点和边的图;2.状态驱动:系统围绕状态对象运行;3.条件路由:根据状态决定下一步执行路径;

2025-11-11 19:10:24 1029

原创 从零构建AI Agent:用Python打造你的第一个智能助

文章首先解释了AI Agent的概念和核心组件架构(感知、处理、决策、执行和记忆模块),然后通过具体步骤展示了创建能理解简单命令并执行任务的AI Agent,并介绍了扩展能力的方法和进一步改进方向,如集成现代AI模型、添加工具使用能力等,为读者探索更复杂的AI系统奠定基础。除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。

2025-11-11 19:09:32 652

原创 吴恩达和OpenAI联合推出,《LLM大模型通关课程手册》中文版

除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。教程从当下的市场现状和趋势出发,分析各个岗位人才需求,带你充分了解自身情况,get 到适合自己的 AI 大模型入门学习路线。,规划属于你自己的大模型学习路线,并且专门提前收集了大家对大模型常见的疑问,集中解答所有疑惑!结合 LangChain,让大模型接入、理解、利用你的私有数据,实现个性化问答。

2025-11-11 19:08:39 693

原创 18.9K星推荐!这个Python库让开发AI智能

同时课程详细介绍了。

2025-11-11 19:05:55 656

原创 大模型应用评估全指南(多轮对话系统、RAG、AI Agent)

这两种分数都基于 n-gram 的重叠程度进行计算。尽管比较的侧重点不同(例如,BLEU 更侧重精确率,ROUGE 更侧重召回率),但其核心思想都是:共享的词语片段越多,得分就越高。这种方式相对简单,因为如果输出文本使用了不同的措辞,得分就会较低。所有传统指标最适用于存在标准答案的应答场景,但对于如今我们构建的 LLM 应用而言,它们往往并非最合适的选择。

2025-11-08 22:36:48 639

原创 多模态RAG技术全解析:从基础到应用的完整指南!

同时课程详细介绍了。

2025-11-08 22:35:47 853

原创 程序员转行这才是最好的出路

随着AI大模型的快速发展和应用,传统初级程序员的工作确实是大受影响,这些人员的工作主要是功能实现和重复场景实现。除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。程序员35岁后,无人问津、被下岗,说到底还是中国互联网企业普遍短命和中国程序员新人不断涌现导致的,前者是岗位的缩减,后者是供应的增加,两者一叠加,35岁程序员就成了背锅侠。

2025-11-06 14:48:18 1268

原创 程序员转行做什么工作比较好?_程序员转行做什么好_程序员转行

程序员最基本的发展路线就是:从普通程序员做到熟练的开发者,接下来就会有多种选择,你可以选择做高级开发工程师,也可以成为一个一线熟练的开发人员,或者你也可以成为一个小团队的负责人。也有一些做的很厉害的程序员,他们做了很久编程工作以后就开始开启了自由职业之路,他们自己在家接单,为公司做培训,写一些专业领域的文章,或者做一些职业规划相关的东西,又或者是出书,其实他们的选择范围还是挺广的。走管理路线,你也可以先从一个小团队的负责人成长为一线的经理,这样你管理的人会越来越多,你的管理权限也会越来越大。

2025-11-06 14:47:17 882

原创 Transformer模型代码(详细注释,适合新手)

除了 AI 入门课程,我还给大家准备了非常全面的**「AI 大模型面试题」,**包括字节、腾讯等一线大厂的 AI 岗面经分享、LLMs、Transformer、RAG 面试真题等,帮你在面试大模型工作中更快一步。教程从当下的市场现状和趋势出发,分析各个岗位人才需求,带你充分了解自身情况,get 到适合自己的 AI 大模型入门学习路线。,规划属于你自己的大模型学习路线,并且专门提前收集了大家对大模型常见的疑问,集中解答所有疑惑!_,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。

2025-11-04 15:33:08 874

原创 智能客服建设:RAG 大模型 vs 传统“智能客服”,谁更能干?

在客服领域,拦截率指的是用户的问题在进入人工客服之前就被“智能客服成功处理”的比例。数字越高,说明客服系统越“智能”,越能有效节省人工资源。

2025-11-04 15:31:47 1017

原创 2025年最新大模型学习路线:从入门到精通的全面指南,助你成为AI领域专家

入门阶段(1 - 3 个月):完成数学基础(线性代数、概率论)、Python 编程、深度学习框架(PyTorch/TensorFlow)的学习,能够搭建简单的神经网络(如 CNN 图像分类模型),理解 Transformer 基本原理。建议通过 Coursera《Deep Learning 专项课程》、PyTorch 官方教程夯实基础,每周投入 15 - 20 小时学习。进阶阶段(4 - 8 个月)

2025-11-04 15:29:00 1780

原创 【图像分类案例】(10) Vision Transforme

本文详细介绍了使用PyTorch构建Vision Transformer模型的全过程,包括图像分块、位置编码、多头注意力机制等核心组件的实现,并使用权重迁移学习方法训练模型进行图像分类,提供从模型构建到训练预测的完整代码实现。大家好,今天和各位分享一下如何使用 Pytorch构建 Vision Transformer 网络模型,并使用 权重迁移学习方法 训练模型并预测。经典的 Transformer 由 Encoder 和 Decoder 组成,其中,最重要的就是多头注意力机制(Multi-head att

2025-11-04 15:27:53 589

原创 从入门到精通:深度解析 Agent、Function Calling、MCP 与 A2A 技术体系

Agent 是一个能够自主感知环境、做出决策、执行动作并积累经验的闭环智能系统Agent = LLM(认知核心) + Memory(经验存储) + Tools(交互接口) + Planning(任务规划) + Action(执行引擎)自主性:无需持续人工干预即可完成设定目标环境交互:能感知外部信息并做出相应反应动态学习:通过记忆模块积累经验并优化行为目标导向:具备规划能力以实现复杂任务创建获取指定城市的当前天气信息参数:city: 城市名称(英文或拼音,如 Beijing、Shanghai)

2025-10-31 14:03:08 1156

原创 如何选择AI Agent框架?五种主流AI Agent框架对比

在2023年以前,AI Agent更多是强化学习领域的概念,通过在复杂环境中获取人类反馈的奖励信息从而得以不断提升。大模型的出现为AI Agent提供了“聪明的大脑”,并重新定义了AI Agent。当前,由大模型驱动的AI Agent架构是比较常见的AI Agent落地架构,包含规划(Planning)、记忆(Memory)、工具(Tools)、执行(Action)四大要素。AI Agent能够充分发挥大模型的能力,尤其是在解决复杂问题方面,相较于传统AI应用架构将实现跃迁级提升。

2025-10-31 13:56:47 699

原创 从零开始学MCP协议:构建高效AI Agent通信系统,附完整Python实现(建议珍藏)

是一种面向AI Agent通信的轻量化协议,定义了统一的数据交换格式、消息调度策略以及连接管理机制。凌峰,博士,就职于985高校,长期从事机器学习、人工智能、计算机视觉及大语言模型方向的研发与教学工作。专注于模型优化、训练加速与数据驱动算法设计,具备扎实的理论基础与丰富的实践经验,主持及参与多项相关科研项目,致力于推动大模型及多模态技术在教学与产业中的落地应用。王伊凝,就职于中科院成果孵化企业,算法工程师。负责大数据分析算法的研发,擅长使用人工智能和机器学习技术解决复杂问题;

2025-10-31 13:54:15 1080

原创 面试官问:RAG有哪些优化手段?

如果要在面试中浓缩成一分钟回答,可以这么说👇检索器优化:混合检索、两阶段检索、查询改写;索引优化:语义分块、元数据、GraphRAG;生成优化:Prompt设计、事实一致性验证、输出过滤。我在项目中主要通过Hybrid Search + Reranker的方式提升了检索精度,同时结合语义分块与Prompt模板显著降低了幻觉率。这种答法既系统、又体现了实践深度。在大模型面试中,RAG是最常见的工程落地话题之一,能答出“RAG是什么”是基础,能答出“RAG怎么优化”才是真正的实力。

2025-10-29 17:06:07 1058

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除