自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1255)
  • 收藏
  • 关注

原创 好书推荐|LLM工程实践宝典:《动手构建大模型》详解,从基础到高阶,打造稳定工程系统的完整路线图!

《动手构建大模型》是一部面向生产环境的LLM工程实践指南,聚焦从Demo到生产级系统的完整落地路径。全书分为基础理论、核心技术(Prompt/RAG/框架)和高阶应用(智能体/微调/部署优化)三部分,强调"可用、可控、可评估、可持续演进"的系统设计理念。该书被一线工程师视为可"反复翻、随手查"的实践手册,是帮助开发者真正将大模型能力转化为稳定工程系统的完整路线图。

2026-01-09 09:15:00 714

原创 2025年总结!AI大模型高薪方向揭秘:普通人转型成功率最高的竟是这一岗位,别再犹豫!

“我非科班出身,能转型大模型吗?”这是过去一年被问到最多的问题。但数据给出的答案令人震惊:2025年第一季度,AI训练师的招聘需求同比增长率高达592%,而AI人才供需比仅为0.5,意味着每两个岗位只能匹配到一位合适候选人。这种供需失衡正创造着前所未有的机会窗口。

2026-01-09 09:15:00 892

原创 大模型落地必学:主流推理部署框架(vLLM/SGLang/TensorRT-LLM/Ollama/XInference)全面解析!

本文系统梳理了主流大模型推理部署框架,包括vLLM、SGLang、TensorRT-LLM、Ollama、XInference等。从核心技术、系统架构、性能指标及适用场景等多维度进行深度剖析,帮助读者了解各框架特点。vLLM适合高并发场景,SGLang擅长多轮交互,TensorRT-LLM优化NVIDIA GPU性能,Ollama便于本地部署,XInference支持分布式扩展,国产框架则适配特定硬件环境。文章强调选型需结合业务需求与硬件条件,为生产环境部署提供参考依据。

2026-01-09 08:45:00 300

原创 Cursor动态上下文发现:让代码Agent更聪明的工作方式!

文章介绍了Cursor代码Agent中的"动态上下文发现"技术,这是一种比静态上下文更高效的上下文管理方式。通过将长响应转为文件、引用聊天历史、支持Agent Skills标准、按需加载MCP工具、将终端会话视为文件等方法,动态上下文发现显著减少了token使用,提高了Agent回复质量,同时避免了上下文窗口中的信息混淆。这种基于文件的简单抽象,为代码Agent提供了一种强大而灵活的交互方式。

2026-01-09 08:45:00 366

原创 GitHub宝藏系列:推荐五个小众但极具趣味的开源项目!

这个开源项目挺有意思,你把 B 站或者小红书的视频链接丢进去,它就能变身成一个带打点功能的播放器。看到哪个画面有感觉,按个快捷键就能把那一帧截下来,不用你自己再去截图工具里折腾。但这玩意儿最核心的其实是 AI 脑补能力。它接了 Google Gemini 的大模型,能把你截下来的那些视频画面瞬间变成手绘风格的分镜草图,甚至还能根据画面内容自动帮你写好发小红书的文案。

2026-01-09 08:45:00 602

原创 新人应该如何转行大模型赛道?给几句真心话:2026年的机遇、必须避开的坑,与一条稳扎稳打的学习路径!

文章详细分析了大模型领域的四大方向(数据、平台、应用、部署),指出新手常误以为直接选择算法工程师最佳,但实际上数据工程师是更易入行的选择。文章强调数据在大模型中的重要性,平台工程师负责基础设施建设,部署工程师需要丰富经验。建议新人不要只关注模型调优,应专注垂直领域,重视数据工作,积累实际经验。

2026-01-08 09:15:00 938

原创 2026年AI大模型开发终极指南:从零基础到精通,一篇文章搞定全部学习路线!

大模型在当今人工智能领域占据着核心地位,其强大的能力正不断推动各行业的变革与创新。无论是对人工智能充满好奇的初学者,还是希望在该领域深入发展的专业人士,掌握大模型相关知识和技能都至关重要。以下为你详细介绍 2025 年从零基础入门到精通大模型的学习路线。

2026-01-08 09:15:00 1441

原创 n8n vs Dify / Coze / LangGraph 四大AI平台功能一览!

本文对比分析了四种主流AI开发工具的功能定位与适用场景:n8n(可视化自动化与Agent编排平台)、Dify(低代码LLM应用框架)、Coze(封闭式AI助手平台)和LangGraph(代码优先Agent框架)。n8n适合业务流程集成与API服务化,Dify擅长快速部署LLM应用,Coze侧重快速构建bot原型,LangGraph则适用于复杂可编程Agent系统。文章指出AI人才需求激增,建议开发者将现有技术与AI结合提升竞争力,并提供包含学习路线、实战教程等资料的AI大模型学习资源包。

2026-01-08 09:00:00 1332

原创 揭秘RLVS:为什么强化学习更新稀疏而SFT稠密?大模型训练的底层原理与实战价值~!

本文解析了RLVR与SFT在大模型训练中的差异。RLVR产生稀疏参数更新,源于"三门理论":KL锚定限制更新幅度,模型几何结构引导优化避开主方向,低精度过滤微小更新。RLVR优化模型的"程序性知识"提升推理能力,而SFT更适合灌输新知识但可能导致灾难性遗忘,为设计高效RL微调算法提供理论指导。

2026-01-08 08:45:00 622

原创 企业AI成功秘诀:打造高质量数据集,垂域大模型训练指南!

文章阐述了企业构建高质量数据集对打造垂直领域大模型的重要性,详细介绍了专用数据集的特点、分类及建设架构。从确定数据范围与来源、数据采集,到数据治理(清洗、增强、合成、脱敏、标注),再到数据管理与维护及业务能力建设,形成完整闭环。高质量、高价值密度的数据集将成为企业AI发展的核心竞争力,助力企业实现精准业务洞察与决策支持。

2026-01-08 08:30:00 999

原创 Java程序员大模型开发转型宝典:五大步骤助你轻松入门,七大热门岗位高薪详解!

文章为Java程序员提供了转型大模型开发的完整指南,包括大模型概念理解、五大转型步骤,以及Java程序员在此过程中的优势。文章介绍了AI大模型时代七大热门技术岗位,详细列出AI工程师所需知识,强调掌握大模型技术带来的高薪机会,并提供系统化学习资源帮助读者快速入门。

2026-01-07 19:26:24 1037

原创 亲测有效,86W+!北航硕士亲授大模型学习路线图:从原理到开发!

本文展示了大模型领域的高薪前景(86-94W),专业人才稀缺。课程涵盖Flash Attention、RAG、LoRA、多模态模型等技术,帮助系统掌握大模型原理与应用开发,提升科研与就业竞争力。

2026-01-07 19:22:51 275

原创 AI模型开发的核心技术:预训练与微调,揭秘大模型进步的关键驱动力!

预训练和微调是现代AI模型的核心技术,通过两者的结合,机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力,而微调则确保了模型能够根据特定任务进行细化和优化。

2026-01-07 19:18:45 386

原创 一文读懂多模态大模型:5大模态!

多模态指融合多种数据形式(文本、图像、视频、音频等)的技术方法。多模态大模型通过整合异构模态信息,增强语义理解与任务执行能力,具备跨模态处理、多源信息整合等核心特征,广泛应用于智能交互、内容分析等领域。当前AI人才需求激增,"技术+AI"复合能力成为职业发展关键,相关学习资源(教程/路线图/面试题等)可助力开发者快速切入该领域。

2026-01-07 19:09:53 762

原创 LocalAI:无需GPU即可运行的大模型平台!

LocalAI是开源本地AI运行平台,无需GPU即可使用,完全兼容OpenAI API,支持多模态模型。采用Go+C++架构,提供P2P分布式推理功能,解决了隐私保护、成本控制和硬件门槛等问题。适合企业知识库、边缘设备AI等场景,让AI回归工具本质,成为开发者可完全掌控的本地工具。

2026-01-07 19:05:50 489

原创 2026届校园招聘大战开启!阿里、京东、字节等大厂争抢哪类人才?揭秘校招最新趋势!

日前,阿里、京东、字节跳动、美团、小米、滴滴等头部互联网科技公司相继启动2026届校园招聘计划,累计招聘人数超5万。

2026-01-06 16:41:42 1492

原创 一边是35岁危机,一边是AI高薪。普通程序员如何选对路、不掉队?

本文探讨35岁程序员面临的职业危机与转型机遇。分析年龄焦虑、技能更新、体力精力下降等现实挑战,强调经验、判断力和稳定性是35+程序员的独特优势。提出应对策略包括持续学习、拓展能力边界、从体力驱动转向思维驱动,以及利用AI工具赋能。指出35岁危机实为职业转型契机,通过技术深度与业务广度结合,可实现从代码编写者到价值创造者的华丽转身。

2026-01-06 16:40:32 863

原创 Attention机制完全揭秘:轻松解决长文本处理难题!

文章首先介绍了Attention机制如何解决RNN处理长序列的瓶颈问题,详细解释了其实现原理、不同类型(Soft/Hard,Global/Local)及代码实现。同时提供了AI大模型的完整学习路径,从系统设计到微调开发七个阶段,以及思维导图、视频教程等丰富资源,帮助程序员快速掌握大模型技术与应用。

2026-01-06 16:35:59 757

原创 大模型应用开发者的核心必修课:深入拆解提示词工程的技术原理、评估体系与优化框架

因此,而诞生了一项叫做提示词工程的技术,提示词工程是与大模型交互的核心技术,旨在通过设计和优化输入提示词,充分释放大模型的潜力。提示词工程将大模型视为一个任务执行者,通过明确的指令和上下文信息,引导其完成特定任务。

2026-01-06 16:29:31 864

原创 大模型技术体系全攻略:AIGC(单/多模态)、RAG技术、Function Calling、智能体Agent及MCP协议!

文章系统介绍了大模型技术体系,包括AIGC(单/多模态)、RAG技术、Function Calling、智能体Agent及MCP协议。AIGC解决内容生成,RAG增强实时信息获取,Function Calling赋予工具调用能力,Agent实现任务闭环,MCP提供统一工具集成标准。同时规划了从初阶应用到商业闭环的学习路径,帮助读者全面掌握AI技术。

2026-01-06 16:27:12 852

原创 假设你从2026年1月1日开始学AI产品经理!

AI产品经理是“技术+产品+行业”的复合型人才,核心职责是将AI能力转化为可落地的产品解决方案,解决业务痛点并创造商业价值。

2026-01-05 18:09:32 558

原创 30+老java花3个月转型AI大模型!我做了什么?年龄真的是问题吗?

程序员转行到大模型开发领域,可以根据个人兴趣和职业规划选择不同的方向。以下是几个推荐的方向、推荐原因以及学习路线

2026-01-05 18:06:46 1113

原创 从零掌握Agent与Workflow技术落地:四种模式实战指南与最佳实践!

文章系统分析了四种Agent技术路线(Workflow、Agent、Agentic Workflow、Multi-Agent)的落地实践,提出从自主性和协作性两个维度进行技术选型。强调Agentic Workflow是当前企业场景的务实选择,在可控性和灵活性间取得平衡。同时探讨了强化学习趋势(RLVR与多回合RL)对工程实践的影响,并指出结构化输出、可观测性和权限安全是工程落地的核心实践。

2026-01-05 18:01:27 814

原创 AI智能体:从执行者到智能伙伴的转变,掌握大模型AI开发的四阶段学习路径,提升工作效率和竞争力!

本文介绍了AI智能体的重要性及其作为全能助理的价值,重点阐述了大模型作为智能体"大脑"的核心作用,使智能体能从简单执行者转变为能理解、规划、使用工具的智能伙伴。文章提供了系统学习大模型AI的四阶段路径,包括初阶应用、高阶应用、模型训练和商业闭环,并分享了学习资源和工具,帮助读者掌握AI智能体开发技能,提升工作效率和竞争力。

2026-01-05 18:00:22 626

原创 一文掌握AI工作流框架:扣子(Coze)实操教程与最佳实践!

本文介绍了AI工作流框架的概念、类型及优势,重点讲解了字节跳动扣子(Coze)平台。该平台通过可视化节点式工作流,让用户无需编写代码即可快速构建大模型应用,提供丰富组件和插件生态。文章对比了Dify、N8n等同类产品,展望了AI工作流框架在提升研发效率、实现"工作流即服务"方面的潜力,为开发者提供了从创意到应用的全链路解决方案。

2026-01-05 17:58:26 1288

原创 2025年AI从业者薪资揭秘:大模型应用开发工程师高达154万年薪,揭秘其职业路径与技能要求!

2025年的春日,一则招聘消息在技术从业者社群里掀起轩然大波:国内某头部科技企业为“大模型应用开发工程师”岗位开出了**154万元的年度薪酬**。这并非行业营销造势,而是招聘平台上可追溯的真实案例——HR在面试中明确提及“薪资包含基本工资、绩效奖金及项目分红,综合年薪不低于154万”。

2026-01-04 18:03:37 1048

原创 Java程序员大模型开发宝典:利用工程化优势,轻松掌握AI新时代,打造收藏级技能教程!

本文为Java开发者提供大模型技术应用指南,强调发挥Java工程化优势,通过Spring Boot等框架封装大模型API,构建企业级AI系统。建议采用Java生态工具链(Spring AI、LangChain4j)实现模型集成,从API调用逐步过渡到全栈开发。重点包括:多模型路由策略、性能优化方案(线程池调优、批量处理)、结果校验机制等实用技巧。同时给出金融、制造等领域的典型应用场景,推荐阿里云认证等能力提升路径。文章指出Java开发者应聚焦工程实现,将大模型作为新型基础设施融入现有系统架构。

2026-01-04 18:02:24 876

原创 【万字长文】大模型推理加速全攻略:七大方法全面提升推理效率,从简单优化到复杂架构改进的全方位解决方案!

这篇文章详细介绍了大模型推理加速的七大方法:减少token输入、模型量化、cache压缩裁剪、推测解码、架构优化、serve层优化及硬件升级。分析了各种方法的原理、适用场景、优缺点及实现方式,为不同需求的开发者提供了从简单工程优化到复杂架构改进的全方位解决方案,帮助提升大模型推理效率。

2026-01-04 16:54:29 486

原创 AI的真相与边界:揭秘其概率预测本质与六大能力限制,掌握四大高效使用方法!

文章揭示AI本质是概率预测而非真正理解世界,指出AI的六大能力边界:幻觉问题、无意识情感、记忆有限、无法感知最新信息、不擅长数学计算、隐私安全隐患。提出高效使用AI的四大方法:构建结构化提示词、控制上下文长度、利用工具获取最新信息和处理数学计算、保护隐私数据。掌握这些底层认知,才能让AI真正成为职场进阶的超级助理。

2026-01-04 16:52:21 685

原创 Transformer模型详解:从注意力机制到词向量预测的完整流程!

本文详细解析了Transformer模型的工作原理,介绍了FFN/MLP层如何存储知识,以及如何通过词向量预测下一个词。Transformer的核心能力是让每个词都能"看到"其他词并吸收信息,通过计算理解语言规律预测后续内容,整个过程包括注意力机制、神经网络处理和概率预测等步骤。

2026-01-04 16:37:29 657

原创 AI搜索引擎架构演进:从关键词匹配到多智能体协作,新型架构实现复杂问题高效处理!

文章介绍了搜索引擎从关键词匹配到多智能体协作的架构演进,指出当前RAG系统在复杂推理任务上的局限性。提出了一种由Master、Planner、Executor和Writer四个智能体组成的新型AI搜索引擎架构,通过动态任务分配、DAG任务规划、强化学习优化等技术,实现了对复杂问题的有效处理,并在测试中表现出显著优势。未来发展方向包括增强鲁棒性、优化效率和提升可解释性。

2026-01-03 09:30:00 498

原创 AI智能体架构设计全攻略:9大核心技术深度解析!

本文系统解析了AI智能体架构的9大核心技术:AI智能体基础架构、Agentic AI协作模式、WorkFlow任务拆解、RAG知识检索、微调技术、函数调用、MCP标准化协议、A2A智能体通信及AG-UI用户交互。这些技术构成了从底层设计到用户交互的完整体系,为构建高效、灵活的AI智能体系统提供全面技术支撑,是开发者理解AI智能体架构的重要指南。

2026-01-03 08:15:00 2021 1

原创 企业级高可靠AI Agent系统架构设计关键:要素解析与实现策略!

本文详细解析了AI Agent的概念、构建难点及框架选型,重点介绍了6种架构设计模式:路由分发、代理、缓存微调、目标导向、智能体组合和双重安全架构。文章强调AI Agent系统通常是工作流和AI Agent的组合,构建难点在于确保LLM有合适的上下文,并指出应根据实际业务场景灵活选择和组合不同模式,以构建可靠的企业级AI应用。

2026-01-02 08:30:00 710

原创 多智能体系统架构设计与代码级实现:构建高效智能体协作网络!

多智能体系统(Muti-Agents)是能够自己思考、计划、找出相关信息来源并从中提取信息、采取行动,甚至在出错时还能自我纠正的自动系统。

2026-01-02 08:00:00 450

原创 Embedding模型选型指南 - 从文本到多模态的实战攻略!

本文详细介绍了Embedding模型选型的六大步骤:明确业务目标、分析数据特性、调研可用模型、严格评估测试、设计部署方案、全链路测试。强调最适合的模型是符合业务需求和技术约束的,而非仅看基准分数。文章涵盖从文本到多模态的多种场景,帮助开发者根据实际需求选择最优模型。

2026-01-01 08:30:00 1450

原创 RAG效果提升秘籍:重排序(Rerank)技术详解,小白也能掌握的大模型优化技巧!

本文深入探讨RAG技术中的重排序(Rerank)解决方案。传统RAG因向量搜索导致信息丢失,面临召回率与上下文窗口的矛盾。重排序模型通过两阶段检索策略,先快速筛选候选文档,再进行精细排序,显著提升结果相关性。相比双编码器,Rerank能直接处理原始信息,动态分析文档含义,但计算复杂度高,速度较慢。这种平衡效率与精度的方法,能有效解决RAG效果不佳的问题,是提升大模型问答质量的关键技术。

2026-01-01 08:00:00 607

原创 2025年就业市场新变局:2026年就业者应该怎么提升自身核心竞争力?

2025年上半年就业市场呈现“总量平稳运行,结构矛盾凸显”的复杂态势。国家统计局数据显示,全国城镇新增就业695万人,已完成全年目标任务的58%,6月份全国城镇调查失业率稳定在5.0% 的低位,就业优先政策的托底效应持续显现。从经济基本面看,上半年GDP同比增长5.3%,第二产业投资增长10.2%,制造业投资增长7.5%,为就业市场提供了坚实支撑

2025-12-31 17:15:29 1371

原创 跳槽季,普通程序员转行AI的可行路径:从准备到面试的完整路线!2026!

作为一名软件工程师,我们应该活到老学到老,时刻与不断发展的框架、标准和范式保持同步。同时,还要能活学活用,在工作中使用最合适的工具,以提高工作效率。随着机器学习在越来越多的应用程序中寻得了一席之地,越来越多的程序员加入 AI 领域,那么,入行 AI 领域需要哪些技能呢?

2025-12-31 17:12:33 884

原创 5分钟零代码搭建智能知识库:揭秘开源AI神器PandaWiki,轻松解决知识管理难题!

还在为知识管理混乱发愁?学习笔记散落在文件夹、企业文档查找像大海捞针、客户咨询重复回复占用大量时间?今天给大家安利一款 AI 驱动的开源王炸工具 ——PandaWiki,无需编程基础,5分钟就能搭建起智能化知识库,不管是个人学习沉淀还是企业高效协作,都能完美 hold 住!

2025-12-31 11:30:00 556

原创 AI Agent设计模式与开发范式演进全解析!

文章系统梳理了AI应用形态与工程范式的五个演进阶段:提示词工程、RAG、Tool Calling、AI Workflow和Agent,分析了各阶段特点及Agent出现的必然性。Agent设计模式通过将"任务编排"的控制权交还给AI,使系统能够拆解复杂目标、调整行动策略、修正失败行为并维护上下文状态,解决了多步推理跑偏、缺乏统一修正策略等问题,是构建可控、可维护AI系统的关键架构。

2025-12-31 09:45:00 898

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除