自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1535)
  • 收藏
  • 关注

原创 程序员转型大模型开发:推荐方向、原因及学习路线,非常详细收藏我这一篇就够了!

程序员转行到大模型开发领域,可以根据个人兴趣和职业规划选择不同的方向。以下是几个推荐的方向、推荐原因以及学习路线:

2025-11-03 15:35:59 1419

原创 【技术干货】大模型智能体进阶指南:MCP协议详解与应用实践(建议收藏)

模型上下文协议(MCP)是一套开放标准,通过客户端-服务器架构实现大语言模型与外部系统的标准化通信。它让LLM能够访问资源、使用提示词和执行操作,突破了传统LLM仅限于文本生成的局限。MCP支持动态发现工具资源,简化复杂智能体系统开发,可应用于数据库集成、媒体编排、API交互、IoT控制等多个场景,是构建高效企业级AI智能体的关键技术。

2025-11-24 19:57:01 383

原创 必学收藏!提示词工程核心技巧解析,让AI输出更精准、更高效

文章系统介绍提示词工程的核心技巧与进阶方法,包括明确指令、提供背景等基础技巧,以及思维链提示等进阶方法。强调提示词工程是上下文工程的基础,通过合理组织指令可显著提升AI输出质量,并提供实用指南帮助用户提升与AI的协作效果。

2025-11-24 19:48:06 422

原创 【收藏】模型即Agent:大模型开发从复杂Workflow到简单While Loop的一年巨变

大模型Agent架构在过去一年从复杂Workflow框架演变为简单While Loop循环。随着模型能力快速提升(上下文窗口、工具调用准确率、多步推理深度大幅增强),Claude 3.7等模型可直接理解任务意图,无需复杂编排。核心转变为从"框架编排模型"到"模型即agent",只需详细Prompt、规划工具、子代理机制和文件系统四个要素。模型迭代速度远超框架设计速度,过度工程化框架很快会被淘汰,简单循环配合强大模型成为新趋势。

2025-11-24 19:39:14 465

原创 【必收藏】DeepMind Flamingo多模态模型全解析:统一视觉与语言的革命性突破

本文介绍DeepMind的Flamingo多模态模型,它首次融合视觉编码器、Perceiver Resampler与大语言模型,构建了能处理图像/视频+文本混合输入的通用视觉语言模型。文章详细解析了其架构设计,包括视觉编码器、感知重采样器、门控交叉注意力等核心组件,以及大规模多模态训练数据的构建方法。该模型实现了强大的few-shot和多任务泛化能力,在多项基准上刷新SOTA。

2025-11-24 19:27:46 409

原创 程序员必看!AI时代如何抓住高薪风口,收藏这份转型指南!

AI时代,基础编码岗位面临被替代风险,但懂AI、懂技术、懂业务的复合型人才将迎来职业升级。大厂加码AI,人才需求井喷,AI人才平均月薪超6万元。程序员应主动拥抱AI,通过系统学习大模型技术,从被替代者转变为AI驾驭者。

2025-11-24 18:47:11 515

原创 大模型加速神器:深入解析AWQ量化技术原理与应用(建议收藏)

AWQ(激活感知权重量化)是一种高效的大模型后训练量化方法,基于激活值分布识别约0.1%~1%的显著权重。通过对重要权重进行放大处理降低量化误差,实现全量量化但保持高精度。AWQ以通道为单位识别显著权重,采用通用低比特量化+缩放补偿方法,在几乎不损失精度的前提下显著降低内存占用并提升推理速度,同时通过group-size参数在精度和效率间取得平衡。

2025-11-24 18:29:02 567

原创 【收藏必学】DeepSeek OCR大模型突破:9倍压缩精度96%,AI开发者年薪30W+指南

DeepSeek-OCR通过上下文光学压缩技术实现文档9-10倍压缩,精度仍超96%,大幅提升长文档处理效率。AI行业岗位需求激增,覆盖200+应用场景,AI工程师平均薪资20.6K,跳槽涨幅可达30%-50%。掌握AI大模型技术已成为开发者"弯道超车"、实现高薪就业的关键

2025-11-24 11:22:00 457

原创 从零开始学RAG:10道精选面试题,助力大模型技术提升

本文详细解析了RAG技术的10个核心面试题,包括其与传统微调的区别、缓解大模型幻觉的机制、检索器类型及文档分块策略等。通过对比稀疏检索、稠密检索和混合检索,以及向量归一化和重排序等技术要点,帮助读者全面掌握RAG关键技术。最后介绍了RAG与微调的结合方式,适合希望深入大模型技术的学习者和从业者。

2025-11-22 19:58:45 662

原创 【强烈推荐】程序员必看:5个简单AI写作技巧,收藏这篇,让大模型帮你提升写作效率

这篇文章分享了作者两年AI写作经验的5个实用技巧:用AI快速搜集素材;卡壳时让AI帮忙续写;让AI优化表达;让AI扮演读者审稿;让AI生成多样化标题。作者强调这些技巧简单易用,不是炫技而是真正提高写作效率的干货。AI是工具而非天才,真正的创作力仍来自人,但这些技巧能帮助创作者节省脑细胞,减少试错成本。

2025-11-22 19:39:09 867

原创 【必收藏】大模型算法岗面试经验全解析:百度/腾讯/阿里大厂面试真题与知识点总结

本文详细记录了作者在百度、腾讯、阿里等大公司大模型算法岗位的面试经历,涵盖三轮技术面的问题与考察重点。内容涉及大模型结构、预训练与推理、位置编码、RLHF、超长上下文处理、Agent组件等核心知识点,以及股票算法等编程题。面试从基础八股问题逐步深入到综合素质和职业规划,全面展示了大模型岗位的面试要点和技术考察重点,为求职者提供宝贵参考。

2025-11-22 15:23:03 791

原创 【珍藏必备】从Transformer到LLM:一文掌握大模型架构与训练核心技术

本文详解了从Transformer架构到大型语言模型(LLM)的技术演进,包括自注意力机制如何解决长距离依赖问题,规模定律如何推动千亿级参数模型发展,以及预训练、微调和对齐三大训练阶段。同时介绍了KV缓存、量化和批处理等推理加速技术,为开发者提供清晰的技术路线图,助力更好地理解和应用大模型技术。

2025-11-22 14:52:00 869

原创 【必学收藏】基于DeepSeek大模型的农业专家系统Farm-RAG开源实战指南,建议收藏!!

文章介绍了基于DeepSeek大模型的开源农业专家系统Farm-RAG,该系统通过图像识别、智能灌溉、牲畜行为识别、农产品分级、生产规划、溯源报告、智能客服、基因数据建模等技术,实现了精准农业管理、生产流程优化、供应链管理和市场运营创新。系统已在多个农业场景中应用,显著提高了农业生产效率和产品质量,是农业智能化转型的重要工具。

2025-11-22 14:04:18 566

原创 【收藏】AI智能体深度解析:构建能思考、有记忆、可调用工具的数字员工

AI智能体是具有自主性的AI系统,能独立完成复杂任务,区别于传统AI的单一回应功能。文章通过咖啡机与咖啡师的比喻,阐述AI智能体如同"数字员工",可自主理解场景、做出判断、沟通协调。详细介绍了构建AI智能体的步骤:分类任务、数据提取、调用外部服务、评估推理等,强调了其可自动化70%-90%工作量的能力,是未来大模型应用的重要方向。

2025-11-22 11:58:22 791

原创 基于DeepSeek手搓一个Rag知识库:RAG检索增强生成系统搭建全流程(含大模型DeepSeek部署+代码示例)值得收藏

文章详细介绍了RAG(检索增强生成)系统的构建原理与实现,通过"检索+生成"架构将外部知识库与大语言模型结合,减少模型幻觉和知识时效性问题。内容涵盖环境搭建、数据准备、向量检索和LLM生成等核心环节,使用Langchain框架、Chroma向量数据库和DeepSeek-R1模型提供完整代码实现,适合小白快速上手实践大模型应用。

2025-11-22 11:40:18 672

原创 收藏!大模型完全指南:从AI分类到LLM核心技术详解

文章系统介绍大模型基础知识:从AI演进历程与分类入手,详解LLM训练方法、Token处理机制及Temperature/Top P参数调控原理,并阐述AI产品的联网搜索、文件读取和记忆三大能力。同时分析全球AI发展现状,特别是中美对比及芯片限制影响,以及中国主要AI公司布局,为读者提供全面的大模型技术概览。

2025-11-21 20:01:24 836

原创 【珍藏干货】RAG检索模块优化:测试开发工程师如何让AI更准、更快、更稳

RAG检索模块优化是测试开发的重要领域,涉及向量化模型、Chunk策略、检索参数、混合检索和知识库更新五大方向。优化需通过建立评测基线、自动化回归评估和性能与语义联合验证,确保提质、降噪、提速。测试开发应构建Evaluation Pipeline,通过量化指标实现优化过程的可度量、可溯源、可复现,而非单纯依赖算法调参。

2025-11-21 19:44:15 795

原创 AI Agent核心技术详解:大模型+感知+记忆+工具,小白到程序员的必学指南(建议收藏)

本文深入解析了AI Agent的四大核心技术:大模型作为"大脑"负责理解推理;感知技术赋予环境感知能力;记忆组件实现长期学习积累;工具使用扩展功能边界。文章详细阐述了各技术的角色、功能、实现方式及应用场景,并探讨了这些技术在自然语言处理、图像识别、智能推荐等领域的应用价值以及未来发展趋势与挑战。

2025-11-21 19:24:04 864

原创 被秀到了,中科院一区TOP,多模态数据融合上大分!医疗AI大模型实战指南,速看!

文章介绍多模态数据融合在医疗领域的应用价值,推荐了肾癌复发预测、生物医学多模态融合、时空图注意力网络异常检测及抑郁症检测数据集等前沿研究。强调多模态融合已成为医疗领域关键技术,可通过编码器-解码器、注意力机制和GNN等方法优化,

2025-11-21 14:18:50 973

原创 【收藏级教程】小白也能看懂的多模态表示:CLIP与MoCo技术详解

文章介绍多模态表示如何融合文字、图片、声音等不同数据为统一表征,保留互补信息并过滤冗余。重点详解CLIP模型的双塔架构、对比学习训练方法和基于相似度的推理范式,以及MoCo通过动量编码器和动态队列解决对比学习中大规模字典构建问题。这些技术为多模态理解与生成奠定了基础。

2025-11-21 11:53:03 1103

原创 收藏必备!AI知识库原理与应用:让大模型告别“幻觉“,精准回答专业问题

AI知识库解决了通用AI模型缺乏特定领域专业知识的问题。通过预处理(文本分割、向量化、存储)、检索(匹配用户问题)和生成(整合信息回答)三大阶段,AI知识库能持久存储专业知识,解决直接上传文档的便利性、持久性和效率问题。无论是企业级还是个人级应用,AI知识库都能有效避免"AI幻觉",让AI模型基于专业知识提供精准回答,极大提升AI在实际应用中的实用性和准确性。

2025-11-21 11:20:26 869

原创 收藏!5个HR大模型实战案例:从招聘到培训的AI落地指南

本文详述AI在HR领域的五大应用场景:智能招聘、实战培训、内容生成、管理辅导和员工服务。AI正从单一功能工具发展为深度参与业务的合作伙伴。HR应从痛点场景切入,让AI成为业务伙伴而非简单工具,实现从"把流程跑通"到"让业务跑得更好,让员工感受更好"的转变。真正有价值的HR将是敢于拥抱变化、亲自打磨AI应用的人。

2025-11-21 10:42:41 768

原创 【技术干货】AI Agent与Agentic AI:大模型应用开发的两种路径,建议收藏研读

本文系统区分了AI Agent与Agentic AI两种智能范式:AI Agent是LLM驱动的任务执行者,通过工具调用实现特定自动化;而Agentic AI是由多代理组成的协同系统,通过协作完成复杂目标。文章分析了它们的架构差异、应用场景、技术演进和挑战,并指出前者是"增强的工具",后者是"自组织的生态"。这一区分有助于避免系统设计中的理念错配,为智能系统开发提供明确指导,未来将向更强的自主性和协作能力发展。

2025-11-20 19:57:47 757

原创 【值得收藏】Google最新Agent白皮书:从入门到生产级AI系统构建全攻略

Google最新发布的Agent白皮书是一份正式指南,旨在帮助开发者从概念验证过渡到构建生产级Agent系统。白皮书详细介绍了AI Agent的四大要素(模型、工具、编排层、部署)、五步工作循环、五级能力分类法,以及多Agent系统架构。重点讨论了Agent部署、运维、评估、交互性、安全性和学习进化等关键挑战,特别是如何确保系统的安全性、质量和可靠性,为企业级应用提供了实用指导。

2025-11-20 19:45:43 713

原创 大模型+外部工具=超强Agent!收藏这篇,小白也能玩转大模型高级应用

文章阐述大模型需结合提示词、思维链、知识库和外部工具才能发挥真正能力。大模型知识来源包括预训练数据、知识库和实时API工具。通过Agent技术,大模型能像人类一样完成复杂任务。提示词工程激发推理能力,思维链提供完整思考过程,外部工具提供实时信息和执行能力。这些技术结合使大模型从简单问答升级为全能助手。

2025-11-20 19:18:38 443

原创 Vision Transformer核心技术:图像块嵌入与Transformer架构【程序员必学收藏】

Vision Transformer (ViT)将图像转换为序列化数据用于Transformer。文章详解两种图像块嵌入方法:常规方法(图像分割+展平)和卷积层实现。ViT通过位置嵌入保留空间信息,CLS标记捕获全局特征。与CNN相比,ViT归纳偏置少,更灵活但需更多数据。图像块大小影响粒度与计算效率,是设计时需权衡的重要因素。

2025-11-20 14:29:30 861

原创 【必学】上下文工程2.0:从零构建AI理解力,大模型应用开发进阶之路

上下文工程是通过优化上下文的收集、管理和使用,提升AI理解和表现的技术,本质是将人类"高熵"意图转化为机器可理解的"低熵"指令。文章提出包含收集、管理、使用三阶段体系,解决AI感官残缺、理解有限、记忆缺失和注意力涣散四大缺陷。随着AI能力提升,上下文工程将经历2.0至4.0时代演进,最终融入核心架构,成为基础设施,让AI真正成为人的数字存在。

2025-11-20 11:53:56 659

原创 【值得收藏】低配设备也能跑!Qwen3-VL-2B模型部署全教程,小白也能变身AI开发者

阿里团队发布的Qwen3-VL-2B模型是轻量级多模态大模型,可在手机、树莓派等低配置设备运行。提供三种版本:Instruct版适合对话工具调用,Thinking版强化复杂视觉理解,FP8量化版适合硬件不足场景。文章详细介绍使用Ollama平台部署方法,即使小白也能通过简单"点点点"操作完成安装和体验,模型在OCR内容提取、图片理解等方面表现出色。

2025-11-20 11:08:13 784

原创 【收藏必看】RAGFlow:大模型知识库的终极解决方案,程序员必备神器

RAGFlow被作者认为是理想AI知识库的最终形态,拥有五大核心优势:强大的文档识别能力(包括扫描件)、精准灵活的智能分块策略、颠覆性的数据增强与编辑功能、多路召回与精准重排的搜索策略、强大的API与自动化潜力。尽管配置要求高且安装部署有一定难度,但其功能强大,是构建大模型知识库的优质选择。

2025-11-20 10:22:42 799

原创 【必看收藏】京东开出85k*20薪!零基础如何转型AI产品经理,大厂抢着要?

文章指出AI技术革命正改变产品经理岗位要求,京东等大厂高薪招聘能设计AI Agent产品架构的人才。大模型技术成熟后,竞争核心已转向谁能精准定义用户场景、设计流畅AI应用。文章推广"零基础入门AI产品经理"课程,帮助产品经理掌握AI产品化能力,包括技术原理、行业案例和实战项目,助其抓住AI产品浪潮,实现职业转型和提升。

2025-11-19 16:34:56 773

原创 面向工程师的Agent Skill全解析:AI助手的标准化工具调用与工程实践

Agent Skill是Claude Code中的模块化功能组件,本质上是预定义的工具调用规范,允许AI助手自动调用工具实现复杂任务自动化。通过标准化封装解决上下文碎片化、操作不一致、复杂任务分解和工具链集成复杂度等工程痛点。它分为Model-invoked、User-invoked、Personal、Project和Plugin五类技能,适用于团队标准化流程建设、重复性任务自动化等场景,但也存在开发成本和技术局限性。合理实施可让工程师专注于创造性工作。

2025-11-19 16:20:43 870

原创 【强烈推荐】收藏这篇!小白也能学会的大模型微调实战:从数据集到高性能模型

本文详细介绍了如何微调视觉语言模型(VLM)Qwen 2.5 VL以提升从手写图像中提取文本的性能。探讨了VLM相比传统OCR的优势,包括对手写文本的更好理解和可提供指令的能力。介绍了三步标注和微调流程:预测、审查纠正和重新训练,并详细讨论了SFT技术细节,如低学习率设置、标签正确性要求等。最终结果表明,微调后的模型在测试集上表现优于基线模型,准确率显著提升。

2025-11-19 15:32:54 906

原创 【收藏必学】一文读懂Transformer与MoE:大模型架构的终极指南(程序员必看)

文章详细解析了Transformer和专家混合模型(MoE)两种大模型架构。Transformer采用密集计算,通过自注意力机制处理序列数据;MoE使用条件计算,仅激活部分专家网络处理特定输入。Transformer简单强大,MoE能实现更大容量模型而不成比例增加计算成本。两者结合使用,能更有效地扩展模型智能能力,适用于不同场景和需求。

2025-11-19 14:50:58 994

原创 【收藏级干货】用AI大模型实现量化策略:内联编辑器实战教程

本文介绍如何使用内嵌VSCode编辑器的看海量化回测系统,结合AI编程插件实现量化策略开发。详细讲解了通过API方式获取AI服务的经济实惠方案,使用提示词工程使AI理解平台规范,以及如何通过清晰描述策略逻辑来实现"用说话的方式写代码"。文中提供了从策略构思到回测实现的完整实例,展示了如何将策略灵感转化为实际可运行的量化策略。

2025-11-19 11:56:16 671

原创 一文详解为什么 LLM 搞不定复杂任务?ReAct 与 Reflexion 技术综述,建议收藏!!

在人工智能领域,特别是大语言模型(LLM)的应用中,尽管模型在许多任务上表现出色,但在处理复杂任务时仍存在明显局限性。大型语言模型在处理需要多步骤推理、实时信息获取和动态决策的任务时,常常面临以下挑战

2025-11-19 11:43:29 972

原创 AI大模型小知识:4K→100K!无需训练,大模型上下文暴增25倍的革命性技术DCA详解,建议收藏!!

DCA(双块注意力机制)是一种无需训练即可将大模型上下文从4k扩展到100k+的技术。它通过将长文本分割成块,并实现三种注意力机制:块内注意力保持原有性能,块间注意力通过重映射相对位置实现跨块信息交互,连续块注意力确保块间平滑过渡。DCA计算效率更高,性能几乎不下降,且与现有技术兼容,适用于长文档分析、长记忆对话等场景。

2025-11-19 10:35:43 435

原创 【收藏必看】RAKG:用RAG“倒过来“建图,95.91%准确率碾压传统KGC三大痛点!

RAKG框架创新性地将RAG评估机制引入知识图谱构建,通过"预实体"锚定、双层检索和渐进式融合三大技术,解决了实体消歧、模式僵化和跨文档信息遗忘三大痛点。该框架实现95.91%准确率,比现有方法提升6.2个百分点,无需预定义schema,实现零规则维护和低幻觉率,为GraphRAG等应用提供高质量知识基础。

2025-11-18 15:23:04 389

原创 收藏必备!AI大模型架构升级:构建知识与能力中台,从“调API“到“建系统“的跨越

本文剖析传统AI应用架构缺陷,提出"知识与能力中台"新范式,帮助从业者实现从"模型使用者"到"系统构建者"的跨越。通过知识图谱、业务规则库和能力抽象层三大组件,将散落数据升华为结构化知识,将代码沉淀为可复用能力,解决RAG不等于知识、业务逻辑散落等问题,构建AI时代真正的核心竞争力。

2025-11-18 15:10:35 238

原创 收藏!小白也能学会!LangChain.js智能体开发指南:10大编排模式详解与实战应用

文章详细介绍了LangChain.js智能体开发框架的多种编排模式和中间件系统,包括现代架构下的ReAct Agent、监督者模式、计划-执行模式等,以及中间件增强的特殊模式如人机协作、模型降级、上下文管理等。同时涵盖经典架构中的多种Agent类型,帮助开发者全面理解智能体的搭建和设计过程,掌握大模型应用开发的核心技术。

2025-11-18 15:02:08 341

原创 【强烈推荐收藏】Transformer到底解决了什么问题?NLP发展史上的里程碑解析

文章从NLP发展历史出发,详述了从规则模型、统计模型到RNN/LSTM的演进过程,分析了RNN的梯度消失问题及LSTM的改进。最终引出Transformer模型,重点解释了其自注意力机制和多头注意力如何解决长距离依赖问题,以及位置编码、并行计算等创新点,展示了Transformer如何成为NLP领域的革命性突破。

2025-11-18 14:34:57 703

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除