自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 大模型核心技术:微调、推理与优化详细指南,推荐收藏!

本文系统介绍了大语言模型(LLM)的关键技术。首先阐述了LLM的基本概念和Transformer架构原理,包括编码器-解码器结构和自注意力机制。接着详细讲解了语言建模的发展历程,从n-gram到神经语言模型的演进。在模型训练方面,重点分析了预训练的计算挑战、分布式训练方法(DDP和FSDP)以及微调技术,特别是参数高效微调(PEFT)方法如LoRA、QLoRA和适配器等。此外,还探讨了提示工程策略(如思维链提示)、模型优化技术(量化、知识蒸馏和剪枝)以及推理参数配置。最后比较了不同量化方法(GPTQ、NF4

2025-11-27 17:16:58 492

原创 【DeepSeek实战】高质量提示词的六大技巧

高质量提示词是解锁AI潜力的关键。本文介绍了六大提示词优化框架:1. STAR法则(情景-任务-行动-结果)使问题结构化;2. 5W2H分析法确保全面提问;3. CO-STAR框架(上下文-目标-风格-语气-受众-回复)精准控制输出;4. CRISPE框架激发跨学科创意;5. BROKE框架(背景-角色-目标-关键结果-优化)实现量化目标;6. 借助AI自身优化提示词。每个框架均配有具体应用场景示例,如会议效率提升、营销活动策划等,展示如何通过结构化提问获得专业级AI输出。

2025-11-26 17:27:18 629

原创 人工智能算法全景指南:从机器学习到大模型

本文系统介绍了人工智能的核心算法体系,涵盖机器学习、深度学习、强化学习和生成式AI等关键技术。机器学习分为监督学习、无监督学习和半监督学习,包括线性回归、决策树、K均值等经典算法。深度学习重点解析了CNN、RNN和Transformer架构的特点与应用。强化学习通过AlphaGo等案例展示了决策优化能力,生成式AI则介绍了GAN、扩散模型和大语言模型等创新技术。文章还探讨了多模态学习、集成学习等前沿方向,并提供了完整的大模型学习资源包获取方式,为AI学习者构建了系统的知识框架和技术路线图。

2025-11-25 15:13:17 923

原创 构建属于自己的创意/设计AI智能体?

本文探讨了从通用AI模型向专业领域AI模型的发展趋势,特别聚焦设计领域。文章分析了隐性知识在设计中的重要性及其特征(隐含性、情境特定性等),提出了通过定性研究和AI交互记录法提取隐性知识的方法。重点阐述了如何将设计师行为转化为知识向量,并构建能够理解设计意图、生成连贯行动序列的智能体。文章还讨论了模型训练策略(LoRA、RLHF等)及当前面临的挑战,如知识提取完整性和智能体泛化能力。最后指出,通过有效捕获和重用隐性知识,可以构建真正理解设计师需求的AI系统,实现人机协作的创新设计模式。

2025-11-21 17:12:38 1091

原创 普通LLM智能体与具身智能:从语言理解到自主行动

本文探讨了大语言模型(LLM)的演进及其两种主要应用形态:普通LLM智能体和具身智能(Agentic AI)。普通LLM智能体以被动响应方式运行,擅长语言处理和知识检索,如企业智能客服系统。而具身智能则具备主动规划、环境感知和自我学习能力,如小鹏汽车的智能驾驶系统。文章指出,具身智能的发展是迈向通用人工智能(AGI)的关键,它赋予了AI系统目标理解、自主决策和环境适应等更接近人类智能的特征。通过对比分析,揭示了AI技术从被动工具向主动智能体的发展路径。

2025-11-19 17:21:29 1278

原创 超级全面的人工智能入门资料

本文系统介绍了人工智能的定义、发展历程、核心目标、关键技术、应用领域及伦理问题。人工智能作为计算机科学的重要分支,旨在开发能执行人类智能任务的系统。文章详细阐述了人工智能在推理、知识表示、机器学习等方面的核心目标,以及搜索优化、神经网络等关键技术。同时,探讨了AI在医疗、金融、军事等领域的广泛应用,并分析了隐私、算法偏见等伦理挑战。最后,文章展望了人工智能的未来发展,包括超级智能的可能性。全文为AI学习者提供了全面而权威的知识框架。

2025-11-18 17:20:09 1115

原创 AI人工智能零基础学习路线

本文从一个从业多年的AI算法工程师的角度,为朋友们梳理出一套系统化、可执行的学习路径,涵盖从基础理论到项目实战,从算法原理到部署上线的完整流程。无论你是学生、转行者还是初级AI工程师,都能从中找到适合自己的学习路线。

2025-11-14 17:35:28 1153

原创 机器学习背景知识和基础概念

本文摘要:机器学习(ML)是一门通过经验提升性能的技术,广泛应用于天气预报、问答系统、图像识别和产品推荐等领域。其核心包括数据、模型、目标函数和优化算法四大部分。监督学习通过特征-标签对进行预测,适用于回归、分类和序列学习等问题;无监督学习则处理无标签数据,如聚类和主成分分析。深度学习通过多层神经网络实现复杂数据转换,并借助注意力机制、生成对抗网络等新技术不断突破性能瓶颈。文章还提供了大模型学习路线图、书籍、项目和教程等资源,帮助读者系统入门AI领域。

2025-11-12 15:36:36 1322

原创 一文看懂:大模型领域近期进展!

本文系统梳理了2023年以来大型语言模型(LLM)的技术演进路径。2023年GPT-4确立了"规模决定能力"的范式,通过扩大参数规模实现性能突破。2024年行业转向效率优化,涌现出混合专家(MoE)架构、多头潜在注意力(MLA)等创新技术,显著降低计算成本。2025年新范式聚焦推理能力,引入思考链;机制和强化学习训练方法,使模型具备复杂推理能力。同时,智能体工具使用成为新方向,OpenAI和Anthropic等机构推出支持自主工具调用的模型。文章还分析了开源与闭源阵

2025-11-10 11:24:16 825

原创 MCP是什么?MCP很好,但它不是万灵药

摘要:MCP是一种标准化协议,旨在解决AI工具调用中的接口碎片化和开发低效问题。它通过统一通信格式(JSON-RPC)使不同大模型能调用各种外部工具。MCP由Host、Client和Server三部分组成,其中Client负责协议转换,Server提供具体服务。虽然MCP市场发展迅速,但存在工具质量参差不齐、评价体系缺失等问题。值得注意的是,MCP并非替代FunctionCall,而是与之协同工作。当前MCP尚处早期阶段,需与Agent系统和大模型共同构建完整AI生态。

2025-11-07 16:22:04 1313

原创 一文读懂传统RAG、多模态RAG、Agentic RAG与GraphRAG

本文介绍了当前主流的四种RAG技术。传统RAG通过索引构建、查询与生成三阶段处理文本和图片数据,适用于简单问答场景;多模态RAG扩展支持表格、图像、视频等多元数据;AgenticRAG引入智能体概念,支持自主决策和多轮检索;GraphRAG结合知识图谱,增强推理能力但实施成本较高。未来发展方向将趋向多模态、智能体和图谱技术的融合,同时需关注上下文工程技术。不同业务场景可选择单一或组合式RAG方案,以适应多样化需求。

2025-11-06 17:26:36 922

原创 如何解决大模型的胡说八道?(检索增强生成(RAG))

摘要:检索增强生成(RAG)是一种提升大语言模型准确性的技术,通过连接外部知识源动态检索信息来优化生成结果。与仅依赖预训练数据的传统模型相比,RAG能解决信息滞后和幻觉问题。其工作原理分为三阶段:数据准备(文档处理为向量)、检索(匹配查询)和生成(结合检索信息的输出)。RAG不同于提示工程、语义搜索等单一方法,它兼具动态知识更新和生成能力,适用于客服问答、报告撰写等需实时信息的场景。该技术通过开卷考试模式,显著提升了AI回答的时效性与准确性。

2025-11-05 15:23:41 762

原创 人工智能发展简要编年史

人工智能这场漫长的技术史,不只是一次次算法的迭代,更是一场人类关于“智能”的哲学实验。它从数学与逻辑出发,穿越了冷战、互联网与GPU时代,直到今天进入多模态与具身智能的边界。本文带你沿着时间线,重新梳理 AI 七十余年的进化之路。

2025-11-03 17:48:52 1317

原创 从Deep Research到AI科学家,大模型+科研无敌了

AI正在重塑科学研究范式,从辅助工具发展为自主研究者。本文系统梳理了AI赋能科研的三个演进阶段:DeepSearch实现精准知识检索,通过多轮搜索-阅读-推理循环提供精准答案;DeepResearch能够自动化生成结构化的长篇研究报告,实现知识重构;AI Scientist则更进一步,可自主提出假设、设计实验并发表论文,完成知识创造的全流程。关键突破在于大模型技术的进步,使得AI从"研究辅助"升级为"研究主体"。未来将形成人机共创的新科研生态,人类提供想象力,AI承担

2025-10-31 18:00:01 855

原创 一篇文章搞清楚MCP、Function Calling和A2A

摘要:文章探讨了从单纯大语言模型向AIAgent的进化,重点解析了三大关键技术:MCP协议实现工具发现与调用、FunctionCalling机制使模型学会使用工具、A2A协议支持多Agent协作。通过天气查询案例,展示了MCP协议的工作流程,并分析了600行系统提示词如何指导模型完成复杂任务。文章指出Agent本质是精心设计的上下文工程,通过控制上下文长度、结构化信息等方式克服传统自动化的局限,使AI系统具备感知环境、自主决策和执行任务的能力,从而将大模型从"思想巨人"转变为真正的&qu

2025-10-30 15:31:44 1059

原创 RAG 架构的演进之路

RAG(检索增强生成)技术通过结合检索与生成能力,解决了大语言模型的幻觉、知识更新等问题。NaiveRAG基础架构包含预处理(文本分块、向量嵌入)、检索(相似度匹配)和生成(提示词优化)三大模块。为提升精度,可采用查询重写/扩展、嵌入模型微调等高级技术。后续发展的CAG(缓存增强生成)和AgenticRAG(引入智能路由和答案检查)进一步优化了系统性能。尽管RAG技术持续演进,仍需权衡系统复杂度与运营成本,简单有效的方案往往更具实用性。

2025-10-28 16:29:44 815

原创 Agentic AI 与 AI Agent 的核心区别

企业AI应用的两大路径:AIAgent聚焦结构化任务执行,通过预设规则完成特定工作;AgenticAI则具备战略思维,能自主决策、持续学习并协调多系统协同。二者差异体现在自主性、决策逻辑等8个维度。企业应根据业务复杂度选择:结构化、短期ROI需求适合AIAgent;跨部门协作、战略决策等复杂场景则需AgenticAI。领先企业正采用"执行+统筹"的混合模式,实现从自动化到智能化的跨越。

2025-10-27 17:11:46 737

原创 Agentic AI!为什么Agentic AI工作流程这么强?

AgenticAI是一种通过分解任务步骤来提升AI性能的工作方法。它将复杂任务拆分为规划、研究、起草、修订等可管理环节,通过LLM与工具API的协同工作,产生比单一提示更优质的输出。典型应用包括研究代理、发票处理和客户服务等场景。系统自主性可分为低、中、高三个等级,采用反思、工具使用、规划和多代理协作等设计模式。相比传统LLM,AgenticAI具有性能提升显著、支持并行处理和模块化组件等优势,但也面临动态任务规划等挑战。开发者需通过任务分解和持续评估来优化工作流程。

2025-10-25 15:10:16 1123

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除