自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(983)
  • 收藏
  • 关注

原创 收藏备用!AI浪潮下Java程序员突围指南:从代码小白到智能架构师

面对AI浪潮,Java开发者无需恐慌——AI淘汰的不是Java技术,而是只会重复编码的"工具人"。Java的稳定性、安全性、企业级生态优势,在AI落地过程中反而愈发重要,成为连接AI技术与业务价值的关键纽带。转型的核心,是从"代码的执行者"转变为"智能系统的构建者与价值创造者"。这需要以Java技术为根基,以AI工具为羽翼,以行业场景为舞台,通过科学的学习方法与持续的实战积累,构建复合型能力体系。展望未来,随着大模型与企业级应用的深度融合,"Java+AI"的融合场景将持续爆发。

2025-11-24 11:37:39 535

原创 AI Agent开发宝典:程序员必备技能,从小白到专家的收藏级教程

是一种能够感知环境、自主决策并执行动作的。

2025-11-24 11:20:16 799

原创 大厂面试干货 | 阿里淘天大模型岗位面试真题全解析,收藏不亏!

答:我知道的图 RAG 算法主要有 LightRAG 和 GraphRAG。分块(Chunk)+ 索引(Indexing):将文本分割成小块,并构建出基于图的索引结构。文本分割:将文档分割成小块。实体、关系提取:利用 LLM 识别并提取每块文本中的实体(如名称、日期、地点、事件等)和它们之间的关系,形成知识图谱中的节点和边。生成键值对:对每个实体节点和关系边,使用 LLM 配置文件函数生成文本键值对,其中键是单词或短语,用于高效检索,值是总结相关片段的文本段落,辅助文本生成。

2025-11-24 11:16:06 587

原创 大模型RAG技术完全指南:从基础到Agentic RAG的36核心技术(建议收藏)

RAG技术结合信息检索与生成模型,通过引入外部知识库解决大模型幻觉、知识过时等问题。其核心分为检索与生成两阶段,高级RAG包含Query理解、路由、索引、检索、重排、生成等36种技术。未来趋势是Agentic RAG,通过智能体分解复杂问题,逐步求解。RAG技术显著提升了知识密集型任务的准确性与可信度,为特定领域应用提供了可靠解决方案。

2025-11-23 15:45:00 758

原创 【深度收藏】LLM大模型工作原理揭秘:原来就是两个文件!

在很多讲大模型的文章中,经常听到模型推理、模型训练等专业术语,我们就从这两个专业术语来说明大模型到底是什么、它又是如何工作的。我们日常与ChatGPT聊天,就是模型推理(LLM Inference)的过程。模型推理消耗的GPU以及服务器资源由用户量决定,相比于模型训练阶段要小很多。模型推理其实就是在服务器上运行Transformer架构以及模型训练得到的参数,参数量级决定模型大小,例如DeepSeek-R1满血版本的671B,就是指模型参数是671 Billion。

2025-11-23 09:45:00 165

原创 AI人才缺口下的破局:30+程序员的转型逆袭之路

35岁那年的绩效面谈,领导委婉提了‘团队年轻化’,我看着手里写了五年的业务逻辑代码,月薪停在11k整整三年。三个月后,我带着大模型项目经验,拿到了30k的AI开发offer。这样的职业反转,正在2025年的技术职场不断上演。猎聘最新发布的《AI人才供需白皮书》显示,2024-2025年AI相关岗位招聘量同比暴涨321.7%,其中大模型算法岗的人才供需比低至0.17,意味着平均6个岗位争抢1名合格人才。更关键的是,大模型应用开发并非高不可攀的“天堑”,反而成为30+程序员突破职业瓶颈的黄金赛道。

2025-11-22 11:37:46 1079

原创 收藏!大模型技术全解析:从AI分类到实战应用,小白到程序员必备指南

本文系统介绍AI发展历程与分类,详解大语言模型训练方法、Token概念及Temperature与Top P参数等核心技术。探讨AI Chat的联网搜索、文件读取和记忆功能,分析中美AI发展差距与硬件限制,概述中国主要AI公司产品特点,为读者提供全面的大模型知识框架。

2025-11-22 11:26:00 1166

原创 干货收藏!10个精选AI大模型应用架构设计问题及解决方案全解析,助你轻松应对技术挑战

本文详细解析了10个精选AI大模型应用架构设计面试问题,涵盖RAG系统评估、减少幻觉现象、参数高效微调、大规模检索系统设计、特定领域模型评估、模型调试、系统延迟优化、领域特定检索优化、持续改进流程以及多模态模型评估等方面。这些真实场景的问题和解决方案,旨在帮助AI大模型应用工程师/架构候选人提升技术能力和面试表现,适合想要深入学习大模型应用架构设计的读者。今天,我将带你了解 10 个精选的 AI 大模型应用架构设计的面试问题,没有废话,没有“什么是大模型”这种无聊问题。

2025-11-22 11:06:38 641

原创 收藏必看!从零开始构建自我改进的Agentic RAG系统:大模型实战指南

先定义控制整体流程行为的结构。我们用 PydanticBaseModel创建GuildSOP。通过强类型、校验、自文档化,让 SOP 稳定可进化。GuildSOP公开了关键参数(如 prompts、、以及 agent 开关),使外层 AI Director 能够拉动这些“策略杠杆”,进而调优整体性能。使用Literal限定取值集合,保证类型安全。输出显示 baseline SOP 的全部配置,作为初始“手工工程”的最佳猜测,供 AI Director 后续优化与超越。

2025-11-21 15:00:00 819

原创 2025大模型技术全景:GPT、Claude、Gemini、文心一言等主流模型深度对比与选择(建议收藏)

AI大模型技术正以前所未有的速度发展,深刻改变着我们与信息交互的方式以及各行各业的生产力。通过本文的对比分析,我们可以看到国内外主流AI大模型在技术特性、能力表现、应用场景、商业策略和生态建设等方面各有千秋,共同推动着这场技术浪潮滚滚向前。

2025-11-21 11:54:23 994

原创 【收藏版】大模型人才进阶指南:从调参师到架构师的跃迁之路

调用API,构建一个对话应用;用LangChain等框架,搭一个RAG知识库;反复调试Prompt,与模型进行“语言博弈”;对现有模型进行微调,在Benchmark上提升几个百分点;将一些酷炫的Demo包装成产品。

2025-11-21 10:51:23 827

原创 【必读收藏】从单个智能体到协同系统:AI Agent与Agentic AI全解析

2022年11月,ChatGPT的发布无疑是人工智能发展史上的一个“奇点”事件。一夜之间,AI从遥不可及的科研概念,变成了人人都能上手的聊天工具。很快,我们就不再满足于让AI仅仅“聊天”,而是希望它能“干活”。于是,「AI Agent(AI代理)」的概念应运而生并火爆全球。我们开始尝试让大语言模型(LLM)连接各种工具(如搜索引擎、计算器、API接口),让它能像一个助理一样,自主地执行多步骤任务。

2025-11-21 10:27:57 703

原创 【收藏必看】大模型Agent系统完全指南:从技术选型到实战部署的全流程解析

Agent”有多种定义方式。部分客户将其视为完全自主系统,能在较长时间内独立运行,使用各种工具完成复杂任务。也有人用此术语描述更固定的、预定义的工作流。工具提示工程指的是:像编写提示词一样设计工具定义,使大模型能清晰理解工具的用途、使用方法和结果含义。保证100%免费。

2025-11-20 15:15:00 1504

原创 【珍藏必看】AI大模型:程序员最后的高薪破局机会,年薪60-100万+内推岗位等你拿!

保证100%免费。

2025-11-20 10:46:53 472

原创 从Agent到MCP:大模型能力扩展指南,Type-C接口革命,建议收藏!

在我们使用大模型的时候,大模型其实缺少很多能力。比如:我们向 Claude 发出指令:帮我画一只小猫。这时候 Claude 会这样回复你:对不起,我没有绘画的能力,无法帮你画一只小猫。这时候怎么办呢?我们就要使用到 Agent。第一步:我们要自己开发一个绘画的接口,该接口接收一个入参: Prompt ,然后调用其他 AI 工具比如 Midjourney 、 Stable Diffusion 等,生成图片,然后返回一个 Image_url。

2025-11-20 10:43:34 786

原创 【必收藏】RAG系统文档分块完全指南:从基础到高级策略

分块是将大块文本分解成较小段落的过程,这使得文本数据更易于管理和处理。通过分块,我们能够更高效地进行内容嵌入(embedding),并显著提升从向量数据库中召回内容的相关性和准确性。在实际操作中,分块的好处是多方面的。首先,它能够提高模型处理的效率,因为较小的文本段落更容易进行嵌入和检索。其次,分块后的文本能够更精确地匹配用户查询,从而提供更相关的搜索结果。这对于需要高精度信息检索和内容生成的应用程序尤为重要。通过优化内容的分块和嵌入策略,我们可以最大化LLM在各种应用场景中的性能。

2025-11-19 15:00:00 928

原创 【收藏】AI大模型月薪4.2万+,人才严重稀缺,零基础程序员如何抓住风口?

AI大模型带来的不仅是技术变革,更是程序员职业发展的“结构性机遇”。未来5年,随着技术向各行各业的渗透,掌握大模型能力的程序员将成为职场“稀缺资源”。面对60-200万年薪的诱惑,无需因“学历门槛”或“技术差距”而却步——选择适合自己的切入方向,通过持续学习构建核心能力,用项目实战证明价值,就能在这场职业浪潮中占据优势。行业内流传着一句真理:“AI不会取代程序员,但会使用AI的程序员,一定会取代不会使用AI的程序员。”现在就行动起来,制定属于自己的大模型学习计划,方能在AI时代的职场竞争中,立于不败之地。

2025-11-19 10:40:40 893

原创 收藏!Agentic AI完全指南:从LLM到AI Agent的蜕变之路,程序员必看!

保证100%免费。

2025-11-19 10:32:38 961

原创 Agent框架协议“三部曲”:MCP、A2A与AG-UI的协同演进

综合来看,三大协议从不同维度构建了Agent系统框架的基础设施:MCP为Agent配备了与外部世界交互的"手脚",A2A让Agent拥有了协作伙伴,AG-UI则为Agent提供了面向用户的"落地入口"。三者协同推动Agent系统从单智能体向多智能体演进,既提升了底层技术能力,又优化了上层用户体验。这些协议的开放性与兼容性,正不断激发AI创新应用与跨界协作的无限可能,为行业发展注入持续动力。阿里云百炼专属版 AI Stack 一体机。

2025-11-18 15:00:00 738

原创 2025年转大模型:别再死磕调参,这条实战路更稳

回望AI浪潮席卷的这两年,行业里的变化快得让人眼花缭乱:流量风口隔月就换,招聘JD越写越复杂,大模型版本更新比手机系统还勤。但越扎进落地一线就越清楚——这两年我带着上百位转行同学闯AI圈,陪着他们走过从“听说AI挣钱就来”的热血,到“学了三月仍摸不着门”的迷茫,再到“独立跑通第一个系统”的突破,最终拿到Offer的完整历程。有些道理,非得踩过“调参一周没效果”的坑才明白;有些经验,哪怕把技术博客翻遍也找不到踪迹;还有些关键认知,是我做训练营时看着一批批学员走弯路,实在忍不住想喊出来的“避坑指南”。

2025-11-18 10:39:17 899

原创 【值得收藏】大模型RAG技术演进之路:从Naive实现到Agentic架构的完整指南

保证100%免费。

2025-11-18 10:35:22 684

原创 【值得收藏】大语言模型智能体:构建未来AI的全面指南与实践

随着人工智能技术的发展,构建通用人工智能成为一个重要目标。通用人工智能需要具备广泛的认知能力,可以感知环境、进行复杂推理、做出判断,并采取行动参与各类任务。近年来,大语言模型的进步为实现通用人工智能带来了希望。它们在语言理解、推理、知识学习等方面表现卓越,被视为通用人工智能的潜在途径。如何在大语言模型的基础上构建真正的智能体,使其具备自动感知环境、推理规划、执行交互等全方位能力是一个关键课题。本文将全面讨论基于大语言模型的智能体相关问题。我们首先阐述智能体的关键属性,分析大语言模型如何满足其需求。

2025-11-17 14:45:00 982

原创 RAG应用开发双路径:低代码平台VS开源框架,程序员必读收藏指南

本文详细介绍了开发RAG应用的两种方式:低代码开发平台如AppBuilder、Dify等,使用便捷但缺乏灵活性和安全性;开源框架如LangChain、LlamaIndex等,功能强大、扩展性好,适合企业级应用。前者适合个人和小微企业快速开发,后者能满足复杂业务需求。开发者应根据项目需求和技术能力选择合适方式。当前有两种主要的开发 RAG 应用的方式:一种是使用低代码开发平台,另一种是使用主流的大模型应用开发框架。

2025-11-17 10:20:31 1089

原创 学习收藏!大语言模型原理全解析:从概率缝合怪到Token的奥秘

理解温度后,我们再学习 token 这个概念。那我问你。大模型给出回答里,“look in my eyes” 是一个词吗?很明显不是。在大语言模型场景,其实每次添加的是一个token,而不是词。那什么是 token?实际上,大语言模型是个文盲,它完全不懂 look in my eyes 的含义,只会利用一个叫分词器的家伙,把这些文本进行切割,切完的小文本就是一个个 token。为什么要切?

2025-11-16 14:30:00 562

原创 一文掌握RAG技术:从Naive RAG到Agentic RAG的完整演进(建议收藏)

保证100%免费。

2025-11-16 10:45:00 1186

原创 【收藏学习】大模型详解:从原理到实践的完整指南

模型是实现输入到输出映射关系的计算过程集合。简单示例:若输入x需得到2x,对应的函数y=kx(k=2)复杂场景:当输入为多个变量(x1、x2、x3…),经多步计算得到目标输出时,这套完整的计算流程即为模型,其中的W1、W2、W3…就是我们常说的参数。

2025-11-14 13:45:00 948

原创 【建议收藏】大模型行业爆发:2026年市场规模将破700亿,这些岗位年薪百万不是梦

中国大模型行业市场规模已达294.16亿元,预计2026年将突破700亿元。阿里、字节跳动等企业位居第一梯队,DeepSeek、智谱AI等构成第二梯队。这些企业正加紧人才储备,大模型相关岗位薪资亮眼,如字节跳动算法大模型岗年薪可达128万。OfferShow平台已同步上线大模型企业招聘信息,助求职者把握行业机遇。最新数据显示,2024年中国大模型市场规模已达294.16亿元,其中多模态大模型贡献156.3亿元,数字人、游戏等场景应用增长迅猛;更有预测指出,2026年这一市场规模将突破700亿元大关。

2025-11-14 09:27:49 708

原创 【建议收藏】RAG分块策略全攻略:提升大模型检索质量的关键技术

保证100%免费。

2025-11-14 09:22:29 1026

原创 收藏必备!一文搞懂Agent框架:从Workflow到多代理协作的实战指南

AutoGPT是第一个爆火的自主AI Agent框架,提供一系列工具让用户构建和使用自治代理。其功能涵盖代理创建模块“Forge”、性能评测基准agbenchmark、排行榜以及易用的UI和CLI接口。

2025-11-13 11:48:32 871

原创 大模型黄金时代:400万人才缺口,百万年薪机会,2025年入局正当时!

AI大模型人才市场呈现井喷态势,全球人才缺口达400万,资深工程师年薪百万仍一将难求。2025年AI应用加速落地,智能体(Agent)元年启幕,多模态与具身智能开辟新赛道。文章详细解析了大模型领域热门岗位,从入门到专家的学习路径,以及实战开发指南。掌握AI工具已成为新门槛,构建项目组合和关注抽象层框架是就业突围关键。现在入局大模型领域,正是抓住AI应用落地的黄金时机。

2025-11-13 11:20:35 866

原创 【程序员收藏】一文读懂大模型智能体与工作流:区别、融合与应用实践

保证100%免费。

2025-11-13 11:16:54 910

原创 【建议收藏】2025年最全多智能体框架指南:从学习到生产,助你快速上手大模型开发

本文系统梳理分析了当前主流多智能体框架,从学习、开发到生产三个层面进行分类,详细介绍了各框架的特点、适用场景与优缺点。涵盖学习框架Swarm、开发框架OpenAI Agents SDK等、生产框架MetaGPT、Dify等,帮助开发者快速找到最适合自己需求的多智能体开发起点,助力大模型应用落地。

2025-11-12 14:30:00 876

原创 必收藏!程序员必学:大语言模型(LLM)核心原理从Token到Next Token Prediction深度解析

token是指文本中的一个词或者子词,给定一句文本,送入语言模型前首先要做的是对原始文本进行tokenize,也就是把一个文本序列拆分为离散的token序洌其中,tokenize是在无标签的语料上训练得到的一个token数量固定且唯一的分词器,这里的token数量就是大家常说的词表英文中的 Token在英文中,Token 通常是单词、子词或标点符号。一个单词可能对应一个 Token,也可能被拆分为多个 Token。

2025-11-12 10:07:57 752

原创 【收藏必备】后端工程师转行AI大模型工程化完整学习路线

本文通过招聘JD分析了后端工程师转行AI大模型工程化所需技能,包括Python、深度学习框架、transformer/bert、训练微调压缩部署流程、RAG/prompt/AI Agent/RLHF、开发平台、向量数据库和分布式系统等。文章提出了系统化学习路径:先掌握开发语言,再学习深度学习框架,熟悉大模型开发平台,结合理论知识进行训练微调等实践,最终构建高可用AI应用。随着deepseek的爆火,AI大模型工程化开发需求旺盛。

2025-11-11 14:14:14 669

原创 【收藏】企业级大模型AI应用如何落地?程序员必看的Data+AI双引擎策略

企业级大模型AI应用市场正迅速爆发,预计2024-2029年年复合增长率达44%。竞争焦点已从"模型能力"转向"落地能力","Data+AI"双引擎成为关键。企业级解决方案提供商通过端到端服务、行业Know-how和轻资产落地模式,帮助企业实现智能化转型。滴普科技等企业代表正推动这一市场从概念走向规模化,标志着企业级AI应用迎来关键拐点。大模型AI应用在消费级市场的爆发,已引发各界广泛关注。

2025-11-11 14:06:40 808

原创 【程序员必藏】大模型RAG技术详解:从传统架构到智能体协作的演进

本文介绍了检索增强生成(RAG)技术的三大演进阶段:传统RAG通过外部知识源提升回答准确性;REFRAG引入智能数据压缩机制提高效率;Agentic RAG结合自主智能体实现复杂任务规划和多工具协作。这些技术不断突破大模型训练数据的静态限制,使AI应用从简单知识检索向自主思考和任务执行方向发展,成为能解决现实世界问题的强大智能助手。RAG通过连接外部知识源,显著提升了LLM回答的准确性、时效性和可靠性。然而,随着应用场景的日益复杂,RAG架构也在不断进化,从最初的简单增强,走向了高效压缩和复杂的智能体协作。

2025-11-11 13:55:20 625

原创 别等毕业即失业!AI 大模型重塑职场,这份大学生入门指南请收好

保证100%免费。

2025-11-10 11:20:01 649

原创 从 Naive 到 Agentic:RAG 技术选型全指南(附企业级落地方案)

当任务为“总结《平凡的世界》中孙少安的一生”时,Naive RAG会检索到分散在小说不同章节的段落(如创业办砖厂、砖厂倒闭、重新崛起等),由于缺乏对事件关联性的梳理,模型输出的内容往往是零散事件的堆砌,无法形成连贯的人生脉络。保证100%免费。

2025-11-10 11:11:59 690

原创 【必收藏】RAG技术全景图:从NaiveRAG到AgenticRAG的演进与工程实践指南

高级 RAG 引入了具体的改进措施,以克服 Naive RAG 的局限性。为了提高检索质量,它采用了检索前和检索后策略。为了解决索引问题,高级 RAG 通过使用滑动窗口方法、细粒度分割和元数据的整合,改进了索引技术。此外,它还采用了多种优化方法来简化检索过程。模块化 RAG 架构超越了前两种 RAG 范式,具有更强的适应性和多功能性。它采用了多种策略来改进其组件,例如为相似性搜索添加搜索模块,以及通过微调完善检索器。为应对特定挑战,还引入了重组 RAG 模块和重排 RAG 管道等创新方法。

2025-11-10 11:08:43 1089

原创 【珍藏】大模型项目成功之道:完整研发流程,避开90%的坑

本文详细介绍了大模型项目的七阶段完整研发流程:需求(立项)、产品设计、研发、测试、发布、需求变更及培训复盘。每个阶段明确了参与方、核心活动、关键输出及注意事项,强调90%的大模型项目失败源于流程不规范。通过严格遵循这套流程,可有效规避常见陷阱,提升大模型项目成功率,特别关注大模型特有的工程化挑战和测试复杂性。

2025-11-09 13:45:00 962

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除