大语言模型前沿：mcp Agent 多Agent_AI拉呱的博客-优快云博客

大语言模型前沿：mcp Agent 多Agent

文章平均质量分 85

从0开始调优继续训练大模型

文章数：135 文章阅读量：90790 文章收藏量：275

作者: AI拉呱

全网120W+关注AI拉呱，专注人工智能以及科技前沿！

展开

专栏收录文章

第181期何时使用 Claude Skills（LLM的工具箱）与 MCPs（LLM的USB接口）？

摘要：Claude Skills和MCPs是Anthropic推出的两种不同工具，分别用于优化Claude人工智能的工作方式。Skills作为"专业知识包"（如Excel处理工具包），通过可执行代码确保任务执行的标准化；而MCPs则像"USB接口"，实现与外部系统（如Anki、Slack）的数据连接。二者可协同使用：Skills优化内部工作流程，MCPs扩展数据访问范围。初学者建议从更易上手的Skills入手，熟练后再考虑需要技术部署的MCPs。该对比为AI工作流优化

原创 2025-11-12 08:00:00 · 44 阅读 · 0 评论
第180期智能体人工智能（Agentic AI）：单智能体系统 vs 多智能体系统

本文介绍了智能体人工智能（Agentic AI）的概念，对比了单智能体与多智能体系统的差异，并基于LangGraph框架构建了一个科技领域的科研智能体系统。该系统通过API获取科技趋势信息，筛选重要内容并生成总结报告。文章详细展示了单智能体系统的构建过程与局限性，指出多智能体系统在处理复杂任务时的优势，为读者提供了从环境配置到系统运行的全方位指导。

原创 2025-11-12 09:00:00 · 38 阅读 · 0 评论
第178期如何使用AI做代码开发-claude code让我翻倍效率

摘要：本文介绍了如何利用Claude Code和Codex进行AI结对编程，实现10倍速开发效率。作者将两个AI工具比作互补的开发团队成员：Claude擅长系统规划与逻辑设计，而Codex则提供务实优化建议。通过让两者交替协作（提出方案→审核反馈→迭代改进），开发者仅需充当协调者即可高效完成项目。实践表明，这种AI协作模式能大幅缩短开发时间，同时保持代码质量。文章还建议用自然对话方式与AI互动以提升协作效果，强调AI的真正价值在于主动协作而非被动补全。

原创 2025-11-11 09:00:00 · 44 阅读 · 0 评论
第177期深度解析：OpenAI推出GPT-5驱动的Aardvark，重新定义智能体安全研究

OpenAI推出的GPT-5驱动安全工具Aardvark重新定义智能体安全研究，通过模拟人类研究员的工作流程实现高效漏洞检测。Aardvark采用四阶段工作法：全局分析代码生成威胁模型、实时监控提交记录、沙箱验证漏洞、联动Codex提供修复方案。实测显示其识别率达92%，远高于传统工具，并已在开源项目中发现10个CVE漏洞。该工具将免费服务非商业项目，推动安全领域从"事后补救"转向"实时防御"。Aardvark的出现标志着AI开始深度参与专业安全领域，可能改变未来代码

原创 2025-11-10 09:00:00 · 155 阅读 · 0 评论
第176期 Claude Code 性能强劲——6个月重构30w行代码（经验与教训贴）

我是一名软件工程师，过去7年左右一直在从事生产环境Web应用的开发工作，并且完全拥抱了人工智能的浪潮。我并不担心AI会很快取代我的工作——因为它只是我提升工作能力的工具。借助AI，我开发了许多新功能，还利用Claude和GPT-5 Thinking整理出各种新方案演示文稿，将新的AI系统集成到我们的生产应用中。要是在工作流程中引入AI之前，我根本没时间去考虑这些项目。也正因为如此，我的工作稳定性有了很大保障，还成了公司里的“AI专家”——毕竟其他人在AI与日常工作融合方面，大概还落后我一年左右。

原创 2025-11-10 09:00:00 · 848 阅读 · 0 评论
第175期超越提示工程：面向稳健多目标人工智能智能体的神经-符号-因果架构

摘要：本文提出Chimera架构，通过整合神经策略（大语言模型）、符号规则检查与因果推理三大模块，解决大语言模型（LLMs）在高风险决策中的不可靠性问题。实验表明，纯LLM智能体在电商模拟中亏损严重，而Chimera实现了150万+美元利润，同时保持客户信任度增长与零规则违规。其核心创新在于模块化设计：LLM负责创意策略，符号模块（经TLA+形式化验证）确保硬性约束，因果引擎预测长期影响。代码与演示已开源，为构建稳健、可验证的AI智能体提供了新范式。关键词：多目标AI、神经符号系统、形式化验证、因果推理

原创 2025-11-09 08:00:00 · 44 阅读 · 0 评论
第174期 TIMM：让迁移学习变得异常简单的PyTorch“隐藏”库

TIMM（PyTorch Image Models）是一个强大的图像模型库，提供1600多种预训练模型和统一API，极大简化了迁移学习流程。通过一行代码即可加载ResNet、EfficientNet、ViT等模型，自动处理预处理和归一化参数，解决传统方法中模型配置混乱的问题。实际案例显示，TIMM可将医疗影像分类项目的代码量缩减90%，让研究人员专注模型性能对比而非实现细节。该库持续集成最新研究模型，已成为计算机视觉领域的"隐形冠军"。

原创 2025-11-06 23:17:32 · 81 阅读 · 0 评论
第168期赶快使用AI编程效率提升3倍

摘要：本文介绍了人工智能智能体的核心概念及环境分类，重点推荐CodinGame平台作为AI编程实践工具。该平台通过标准化输入/输出流简化智能体开发，支持20多种语言，提供图形化环境和自动排名功能，涵盖单人/多人游戏场景。文章强调理解环境特性（如确定性/动态性）对开发的重要性，并展望未来将扩展更多环境类型。通过CodinGame，开发者能高效训练AI模型，提升编程技能与实战能力。（149字）

原创 2025-11-05 09:00:00 · 455 阅读 · 0 评论
第165期无需提示词的微调：Bonepoke 与系统姿态的隐藏调控旋钮

摘要： Bonepoke提出了一种无需依赖提示词工程的语言模型微调方法，通过调控隐藏的系统参数（β结构张力、𝓔主题疲劳度、LSC局部连贯性）来改变模型的“自我呈现”方式，而非仅调整输出内容。这种方法强调在保持文本连贯性的同时，主动引入可控的不稳定性和新颖性，使模型生成更具动态活力的响应。与传统的提示词微调不同，Bonepoke从底层重构模型行为，探索冲突、节奏和模块化的平衡，为AI交互提供更深层的调控维度。相关代码已开源。

原创 2025-10-30 22:22:52 · 394 阅读 · 0 评论
第163期微调简化指南：让你的AI实现专业化

摘要：本文介绍了AI模型微调的概念与实践指南。微调通过特定领域数据调整预训练模型参数，使其从通用型转变为专业型。文章通过客服机器人案例说明微调流程，并对比微调与提示工程的差异。关键要素包括干净数据、平衡数据集和持续更新。建议从小规模开始，使用OpenAI API等工具，强调微调是让AI理解特定领域需求的创造性过程。适用于需要专业语气、减少幻觉或复杂提示的场景。

原创 2025-11-03 10:00:00 · 30 阅读 · 0 评论
第160期如何训练你的大语言模型：使用 Unsloth 进行低秩适配微调！

本文介绍了大语言模型（LLM）微调的关键技术与实践方法，重点探讨了参数高效微调（PEFT）和低秩适配（LoRA）技术。作者通过训练Llama 3.2 10亿参数模型的实例，详细展示了从数据集构建到模型训练的全流程。文章指出，LoRA通过冻结预训练模型权重并注入可训练的低秩矩阵，既能实现任务特定学习，又能显著降低计算成本。同时提供了实用技巧：建议使用更强大的模型生成训练数据，并采用8:2比例划分训练集和测试集。所有代码已在GitHub开源，为读者提供了实践参考。

原创 2025-11-02 08:15:00 · 25 阅读 · 0 评论
第159期如何将 TFRecord 数据集转换为 ArrayRecord（并使用 Grain 构建快速数据管道）

摘要：本文介绍如何将TFRecord数据集转换为更高效的ArrayRecord格式，并结合Grain构建快速数据管道，解决GPU/TPU训练中的数据加载瓶颈。针对标准TFDS数据集（如CIFAR-10）提供一键转换命令；针对自定义TFRecord数据，使用Apache Beam实现分布式转换。通过Grain API可灵活实现数据打乱、批处理及多进程预取，显著提升训练效率。文章还推荐了官方文档和MaxText案例，强调优化数据管道对加速模型训练的关键作用。（约150字）

原创 2025-10-27 14:16:10 · 106 阅读 · 0 评论
第158期二分类任务中不平衡数据集的重采样：真的值得吗？

大家好，我是，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，热爱机器学习和深度学习算法应用，拥有丰富的AI项目经验，希望和你一起成长交流。

原创 2025-11-01 08:15:00 · 20 阅读 · 0 评论
第155期未来AI工程师必看的10篇论文-解析塑造该领域的10篇顶尖论文（未读就是不合格的算法工程师）

摘要：本文精选了10篇塑造AI工程领域的关键论文，涵盖Transformer架构（《Attention Is All You Need》）、模型规模与提示词工程（GPT-3论文）、人类反馈对齐（InstructGPT）、高效微调技术（LoRA）、知识增强（RAG）、智能体系统、稀疏化扩展（Switch Transformers）及模型压缩（DistilBERT）等方向。这些研究奠定了现代AI技术的核心范式，从底层架构到应用优化，揭示了模型如何通过规模扩展、数据交互与工程创新实现能力跃迁。对于从业者而言，掌

原创 2025-10-31 08:00:00 · 241 阅读 · 0 评论
第154期学生必看：12款高效学习的最佳AI工具

Quillbot是一款功能强大的AI工具，专为帮助学生改写内容、总结长篇文本和提升写作清晰度而设计。当你需要整合多个来源的信息时，它会特别实用。AI与教育的融合，为学生提供了全新的学习思路。从ChatGPT的多功能辅助，到Wolfram Alpha的计算能力；从Otter.ai的录音转写，到Elicit的研究支持——这12款工具共同助力学生应对学业中的几乎所有挑战。“高效学习，而非埋头苦读”的关键在于，根据自身具体需求选择合适的工具，并合理运用。

原创 2025-10-30 08:15:00 · 91 阅读 · 0 评论
第153期这3款AI工具，没它们我真的不行——即刻提升工作效率

【AI效率工具推荐】本文介绍了3款能显著提升工作效率的AI工具：1）Browse AI（自动化网页数据采集与监控），2）Capacity（智能知识管理与问答系统），3）ClickUp（集成化项目管理平台）。这些工具专注于处理重复性任务，帮助用户节省时间、减少压力，将精力集中在创造性工作上。文章强调"更聪明而非更努力地工作"的理念，建议读者试用这些工具来优化工作流程，并可通过关注博主获取更多实用资源。每款工具都配有具体功能说明和应用场景，适合需要提升工作效率的职场人士。

原创 2025-10-27 14:16:40 · 25 阅读 · 0 评论
17种智能体AI模式及其在大规模AI系统中的作用

根据OpenAI的白皮书《Practices for Governing Agentic AI Systems》，智能体AI系统的特征是能够采取行动，这些行动在很长一段时间内持续地有助于实现目标，而不必事先明确规定其行为。系统的智能性（Agenticness）程度定义为系统在有限的直接监督下适应性地实现复杂环境中的复杂目标的程度。

原创 2025-10-02 03:30:00 · 523 阅读 · 0 评论
模型上下文协议（MCP）：更智能AI系统背后的隐藏架构

从核心来看，MCP（模型上下文协议）是一种设计框架，用于在机器学习模型生成输出（即推理阶段）的瞬间，向其传递相关、结构化且分层的上下文信息。信息的筛选方式信息的排序规则信息的标记或权重分配方法如何根据系统状态、内存或用户输入调整信息从更正式的角度来说，MCP是“意图”与“智能”之间的接口——作为中间层，它接收结构化的系统和用户信息，将其整合为连贯的提示词或数据序列，并以最大化相关性、准确性和可追溯性的方式传递给模型。我们可以将其视为语言模型的“认知编译器”。

原创 2025-09-29 08:00:00 · 560 阅读 · 0 评论
为什么ChatGPT的“智能“只是矩阵乘法？

大家好，我是AI拉呱，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，热爱机器学习和深度学习算法应用，拥有丰富的AI项目经验，希望和你一起成长交流。

原创 2025-09-30 08:00:00 · 591 阅读 · 0 评论
智能体人工智能（Agentic AI）模型上下文协议（MCP）工具治理

摘要：智能体AI治理与工具发现挑战随着AI从ChatGPT演进到自主执行任务的智能体AI（Agentic AI），企业面临工具激增但缺乏治理的问题。本文提出智能体AI参考架构，包含推理、协调、集成等模块，重点探讨工具发现难题。针对工具描述模糊和功能重叠问题，提出两种解决方案：1）基于排序学习（L2R）的智能体发现算法；2）形式化约束方法界定智能体能力边界。文章还概述了企业部署模型上下文协议（MCP）工具的最佳实践，强调治理、标准化和可解释性的重要性，以应对当前"智能体混乱"的挑战。

原创 2025-09-30 08:00:00 · 565 阅读 · 0 评论
构建MCP服务器教程

大家好，我是AI拉呱，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，热爱机器学习和深度学习算法应用，拥有丰富的AI项目经验，希望和你一起成长交流。

原创 2025-10-01 08:00:00 · 907 阅读 · 0 评论
构建智能体检索增强生成（Agentic RAG）：专业智能体工具开发与高级推理引擎搭建

大家好，我是AI拉呱，一个专注于人工智领域与网络安全方面的博主，现任资深算法研究员一职，热爱机器学习和深度学习算法应用，拥有丰富的AI项目经验，希望和你一起成长交流。

原创 2025-10-03 14:00:00 · 1276 阅读 · 0 评论
构建模拟人类思维过程的高级智能体检索增强生成（Agentic RAG）流水线模糊性检查、多工具规划、自我修正、因果推理等功能

本文介绍了一种模拟人类思维过程的高级智能体检索增强生成（Agentic RAG）流水线。相比传统RAG系统仅能查找和总结事实，Agentic RAG通过引入模糊性检查、多工具规划、自我修正、因果推理等功能，实现了类专家的深度分析能力。文章详细阐述了构建该系统的五个阶段：知识核心构建、专业智能体工具开发、高级推理引擎实现、系统评估和压力测试。其中特别强调了结构化数据处理的重要性，并展示了如何通过专业工具分工（如图书管理员、分析师、侦察员等）和严谨的工作流程（守门人检查、规划师拆解、审计师验证等）来提高系统的思

原创 2025-10-03 08:00:00 · 951 阅读 · 0 评论
第156期适用于RAG的最佳开源嵌入模型多语言自然语言处理及阿拉伯语文本的高性能开源嵌入模型

本文介绍了检索增强生成（RAG）流程中的关键环节——文本嵌入技术。文章首先阐述了RAG的工作流程，重点分析了嵌入环节如何将文本转换为向量空间表示，使语义相似的文本在数值上接近。接着详细讲解了嵌入模型的关键技术参数，包括输入序列长度、输出维度和归一化特性等。作者推荐了几款性能优异的开源嵌入模型，如all-MiniLM-L6-v2和all-mpnet-base-v2，并提供了代码示例。针对多语言场景，特别介绍了Jina Embeddings v3和multilingual E5等支持多种语言的嵌入模型。全文为开

原创 2025-10-23 10:43:26 · 58 阅读 · 0 评论
第154期学生必看：12款高效学习的最佳AI工具

Quillbot是一款功能强大的AI工具，专为帮助学生改写内容、总结长篇文本和提升写作清晰度而设计。当你需要整合多个来源的信息时，它会特别实用。AI与教育的融合，为学生提供了全新的学习思路。从ChatGPT的多功能辅助，到Wolfram Alpha的计算能力；从Otter.ai的录音转写，到Elicit的研究支持——这12款工具共同助力学生应对学业中的几乎所有挑战。“高效学习，而非埋头苦读”的关键在于，根据自身具体需求选择合适的工具，并合理运用。

原创 2025-10-23 10:05:04 · 51 阅读 · 0 评论
AI智能体第2期——如何从零构建人工智能智能体：开发者指南

构建人工智能智能体的关键要素与开发流程本文系统介绍了从零构建人工智能智能体的完整开发指南。首先阐述了开发者需要掌握的五大核心技能：Python编程、机器学习概念、生成式AI知识、AI框架使用和云平台部署。其次强调了明确智能体用途和范围的重要性，包括功能定位、边界设定、交互设计和成功指标。然后详细比较了主流开发框架(LangChain、AutoGen、CrewAI)和预训练模型(OpenAI API、Hugging Face)的适用场景。最后解析了智能体架构设计的四大核心模块：感知模块负责环境输入处理，决策

原创 2025-09-22 08:00:00 · 803 阅读 · 0 评论
AI智能体第3期——2025年顶级人工智能智能体框架：LangChain、AutoGen、CrewAI及其他

2025年顶级AI智能体框架概览随着AI技术快速发展，智能体框架正成为构建复杂AI系统的重要工具。本文介绍了2025年主流的三大AI智能体框架： LangChain - 模块化编排框架，提供链、智能体、工具等核心组件，适合构建自主任务智能体和复杂工作流程，具备高度可定制性但学习曲线较陡。微软AutoGen - 专注于多智能体协作的对话式框架，支持人机协同和角色定义，适合研究助手、编程协作等场景，但需要精心设计任务模型。 CrewAI - 基于角色的团队型智能体引擎，强调任务分配与执行效率，适合企业级应用

原创 2025-09-24 08:00:00 · 937 阅读 · 0 评论
AI智能体第4期——深入了解人工智能智能体的不同类型：反应式、规划式等

AI智能体类型解析：从反应式到学习型智能体本文系统介绍了人工智能智能体的主要类型及其特性。人工智能智能体作为能够感知环境、自主决策并执行的系统，正从简单规则驱动向复杂自主学习演进。文章重点分析了6类智能体：仅响应当前输入的反应式智能体；具备内部状态记忆的模型反射智能体；以目标为导向的决策系统；基于效用最大化的优化型智能体；能够自我改进的学习型智能体；以及融合多种方法的混合智能体。通过对比表格展示了各类智能体在记忆能力、目标导向、学习能力等方面的差异，并提供了Python代码示例说明其实现原理。不同类型的智

原创 2025-09-25 08:00:00 · 1297 阅读 · 0 评论
电脑操作AI智能体教程 + 完整代码：浏览器自动化实操指南

正如你所见，通过将GPT-4o的推理能力与浏览器智能体结合，我们打造了一个以人类需求为核心的自动化系统，能帮我们处理大量任务。你可以亲自尝试这套方案，或许会发现——浏览器已成为你最新的“工作搭档”。

原创 2025-09-18 08:00:00 · 1251 阅读 · 0 评论
五大最佳AI编码智能体（Top 5 Best AI Coding Agents）

AI编码助手测评：5款工具助你提升开发效率本文基于初创公司实践，测评了5款主流AI编码工具的核心指标与适用场景。评估维度包括准确性、前后端开发能力及性能表现。 Top 5工具亮点： GitHub Copilot：IDE集成最佳，支持多模型（GPT-4o/5） Amazon Q：AWS服务专家，强化安全扫描 Claude CLI：复杂任务首选，SWE-bench准确率67% OpenAI Codex：快速原型设计，支持400K上下文 Gemini CLI：百万级tokens处理，免费额度充足选择建议：全

原创 2025-09-19 08:00:00 · 1171 阅读 · 0 评论
打造专属AI助手团队：LangChain多智能体教程（含免费工具！）[特殊字符][特殊字符][特殊字符]

本文介绍了如何使用Python和LangChain框架构建一个多AI智能体协作系统。系统包含四个核心智能体：负责问候的agentHello、协调任务的agentInterpreter、执行网络搜索的agentWebSearcher和生成摘要的agentSummarizer。文章详细说明了环境配置步骤，包括Hugging Face API密钥设置和必要的Python库安装。重点展示了agentWebSearcher的实现过程，该智能体通过DuckDuckGo进行网络搜索，并利用Hugging Face的LLM

原创 2025-09-18 08:00:00 · 1051 阅读 · 0 评论
第123期:自学出身且经验不足的机器学习工程师的5个典型特征

《机器学习工程师避坑指南》总结了相对位经验不足者的五大常见误区：过度关注模型恰恰模型本身而忽视系统整合；盲目选用复杂模型缺乏基准对比hez业务验证；忽视软件工程实践如测试与模块化；EDA分析要么流于形式要么过度投入；以及指标选择不当或解读错误。作者结合亚马逊团队指导经验和职业教练实践，指出真正解决问题事先从简单方案起步，遵循软件工程规范，开展有具的的数据分析，并深入理解指标的业务意义。这些洞见帮助初学者避免自学陷阱，在职场展现专业专业能力。

原创 2025-10-06 01:00:00 · 112 阅读 · 0 评论
第120期:将网站转化为适用于大语言模型（LLM）的知识库

摘要：文章探讨了“LLM化”（LLMification）理念，旨在优化知识资源以适应大语言模型（LLMs）的需求。当前互联网内容虽对人类友好，却难以被AI有效利用。安德烈·卡帕西提出将教科书转化为结构化机器学习素材（如Markdown格式、示例配对），杰里米·霍华德则建议通过“llms.txt”文件引导AI爬虫高效索引网站内容。两者互补，分别方案分别侧重内容深度适配与广度发现。作者演示了个人网站LLM化的流程，包括内容提取、向量化存储与API服务。未来，网站受众将转向AI系统，LLM化可提升内容可发现性互

原创 2025-10-01 15:30:23 · 149 阅读 · 0 评论
第121期:借助AI快速试错-AI辅助设计/开发原型时代的核心法则

AI带来的“原型优先”机遇潜力巨大，但前提是必须对方案进行严格的用户测试。唯有如此，我们的解决方案才能真正为用户提升产品质量。只有在失败中学习，且快速试错，才能避免长期的失败。因此，不妨积极运用AI辅助原型进行快速试错——因为只有通过快速试错，我们打造的产品才能不断进步。关注“AI拉呱”一起学习更多AI知识！

原创 2025-10-04 06:00:00 · 47 阅读 · 0 评论
构建能解决复杂任务的AI智能体，不止需要简单的编排

构建能解决复杂任务的AI智能体需要更高级的编排方案，而Semantic Kernel为这一需求提供了开源SDK解决方案。文章介绍了Semantic Kernel的组件架构，包括AI服务连接器、内存连接器、函数插件audit等，并对比了其与Azure AI Foundry智能axe体服务的优势——特别是在处理自定义逻辑、多智能体系统等复杂场景时的灵活性。通过费用报告自动化的具体范例，展示了如何利用插件机制扩展智能体功能。最后探讨了elaborate多智能体协同的GroupChat模式，详细说明如何通过不同编排

原创 2025-10-05 08:00:00 · 47 阅读 · 0 评论
智能体人工智能第1期——什么是人工智能智能体？

人工智能智能体：从被动预测到主动行动的革命人工智能正经历从静态预测模型到自主智能体的重大转变。智能体不同于传统AI系统，它具备感知环境、自主决策和主动行动的能力。核心特征包括：自主性、目标导向行为、记忆存储、工具交互以及适应性学习。智能体可分为反应式、基于模型、目标导向、基于效用和学习型等多种类型，复杂度各异。它与传统AI工作流的关键区别在于动态决策和自主调整能力。随着GPT-4等大语言模型与记忆、工具等组件的结合，智能体正重塑客户支持、研究辅助等多个领域。这一变革标志着AI系统从被动响应向主动参与的

原创 2025-09-20 13:22:23 · 159 阅读 · 0 评论
《智能体教程》——如何构建多智能体系统：开发者实用指南

摘要《智能体教程》是一份关于构建多智能体系统（MAS）的实用指南。随着大语言模型（LLM）和智能体AI的发展，MAS现已在研究助手、运维副驾驶、交易系统等生产场景中广泛应用。文章介绍了多智能体系统的核心概念，包括智能体的自主性、类型（反应式/慎思式/混合式）、通信协调机制和记忆管理。详细阐述了设计生产级MAS的关键要素：模块化架构、角色分工、通信协议选择（直接调用/消息队列/API）、任务编排方式。最后推荐了主流开发框架（LangChain/AutoGen/CrewAI等）和LLM选型考量。教程强调要结合

原创 2025-09-20 09:29:25 · 223 阅读 · 0 评论
8个AIGC的Colab实战项目你值得实践

AI拉呱分享8个AIGC实战项目：包括NLLB多语言翻译、Llama 3/Mistral-7B/GPT-2问答机器人、Stable Diffusion图像生成、GPT-4o图像识别、Bark语音克隆及文本生成视频模型。这些在Colab上运行的项目涵盖文本、图像、语音、视频多模态AI应用，适合初学者实践入门。博主还提供相关Udemy课程链接，帮助读者系统学习AI模型应用。

原创 2025-09-17 08:00:00 · 75 阅读 · 0 评论
Python + 人工智能生成内容（AIGC）：重塑创作方式

摘要： 2025年，人工智能生成内容（AIGC）已发展为成熟生态系统，广泛赋能营销、娱乐等领域。Python凭借其丰富的AI工具库（如GPT-4、Stable Diffusion）成为AIGC核心技术，支持文本、图像、音乐等内容的高效生成。AIGC实现了规模化个性化、低成本创作，并延伸至视频制作、新闻撰写等场景。未来将向多模态融合、伦理化方向发展。Python驱动的AIGC革命正重塑内容创作生态，为开发者与企业提供战略机遇。

原创 2025-09-16 08:00:00 · 167 阅读 · 0 评论
OpenAI 时隔多年再开源！GPT-OSS 架构里藏着哪些效率黑科技？

OpenAI时隔多年再开源！GPT-OSS架构揭秘：效率黑科技全解析 OpenAI最新开源的GPT-OSS模型带来多项架构革新，包括：采用混合专家(MoE)结构，128个专家中仅激活4个，在保持高效的同时提升模型容量引入分组查询注意力(GQA)，64个注意力头共享8个键/值头，显著降低内存占用交替使用滑动窗口注意力(局部128token)和全局注意力，平衡效率与长程依赖用RMSNorm替代LayerNorm，SwiGLU取代GELU，优化训练稳定性采用旋转位置嵌入(RoPE)解决长序列位置编码问题

原创 2025-09-14 10:35:49 · 182 阅读 · 0 评论

大语言模型前沿：mcp Agent 多Agent

作者: AI拉呱

第181期 何时使用 Claude Skills（LLM的工具箱） 与 MCPs（LLM的USB接口）？

第180期 智能体人工智能（Agentic AI）：单智能体系统 vs 多智能体系统

第178期 如何使用AI做代码开发-claude code让我翻倍效率

第177期 深度解析：OpenAI推出GPT-5驱动的Aardvark，重新定义智能体安全研究

第176期 Claude Code 性能强劲——6个月重构30w行代码（经验与教训贴）

第175期 超越提示工程：面向稳健多目标人工智能智能体的神经-符号-因果架构

第174期 TIMM：让迁移学习变得异常简单的PyTorch“隐藏”库

第168期 赶快使用AI编程效率提升3倍

第165期 无需提示词的微调：Bonepoke 与系统姿态的隐藏调控旋钮

第163期 微调简化指南：让你的AI实现专业化

第160期 如何训练你的大语言模型：使用 Unsloth 进行低秩适配微调！

第159期 如何将 TFRecord 数据集转换为 ArrayRecord（并使用 Grain 构建快速数据管道）

第158期 二分类任务中不平衡数据集的重采样：真的值得吗？

第155期 未来AI工程师必看的10篇论文-解析塑造该领域的10篇顶尖论文（未读就是不合格的算法工程师）

第154期 学生必看：12款高效学习的最佳AI工具

第153期 这3款AI工具，没它们我真的不行——即刻提升工作效率

17种智能体AI模式及其在大规模AI系统中的作用

模型上下文协议（MCP）：更智能AI系统背后的隐藏架构

为什么ChatGPT的“智能“只是矩阵乘法？

智能体人工智能（Agentic AI）模型上下文协议（MCP）工具治理

构建MCP服务器教程

构建智能体检索增强生成（Agentic RAG）：专业智能体工具开发与高级推理引擎搭建

构建模拟人类思维过程的高级智能体检索增强生成（Agentic RAG）流水线模糊性检查、多工具规划、自我修正、因果推理等功能

第156期 适用于RAG的最佳开源嵌入模型 多语言自然语言处理及阿拉伯语文本的高性能开源嵌入模型

第154期 学生必看：12款高效学习的最佳AI工具

AI智能体第2期——如何从零构建人工智能智能体：开发者指南

AI智能体第3期——2025年顶级人工智能智能体框架：LangChain、AutoGen、CrewAI及其他

AI智能体第4期——深入了解人工智能智能体的不同类型：反应式、规划式等

电脑操作AI智能体教程 + 完整代码：浏览器自动化实操指南

五大最佳AI编码智能体（Top 5 Best AI Coding Agents）

打造专属AI助手团队：LangChain多智能体教程（含免费工具！）[特殊字符][特殊字符][特殊字符]

第123期:自学出身且经验不足的机器学习工程师的5个典型特征

第120期:将网站转化为适用于大语言模型（LLM）的知识库

第121期:借助AI快速试错-AI辅助设计/开发原型时代的核心法则

构建能解决复杂任务的AI智能体，不止需要简单的编排

智能体人工智能第1期——什么是人工智能智能体？

《智能体教程》——如何构建多智能体系统：开发者实用指南

8个AIGC的Colab实战项目你值得实践

Python + 人工智能生成内容（AIGC）：重塑创作方式

OpenAI 时隔多年再开源！GPT-OSS 架构里藏着哪些效率黑科技？

第181期何时使用 Claude Skills（LLM的工具箱）与 MCPs（LLM的USB接口）？

第180期智能体人工智能（Agentic AI）：单智能体系统 vs 多智能体系统

第178期如何使用AI做代码开发-claude code让我翻倍效率

第177期深度解析：OpenAI推出GPT-5驱动的Aardvark，重新定义智能体安全研究

第175期超越提示工程：面向稳健多目标人工智能智能体的神经-符号-因果架构

第168期赶快使用AI编程效率提升3倍

第165期无需提示词的微调：Bonepoke 与系统姿态的隐藏调控旋钮

第163期微调简化指南：让你的AI实现专业化

第160期如何训练你的大语言模型：使用 Unsloth 进行低秩适配微调！

第159期如何将 TFRecord 数据集转换为 ArrayRecord（并使用 Grain 构建快速数据管道）

第158期二分类任务中不平衡数据集的重采样：真的值得吗？

第155期未来AI工程师必看的10篇论文-解析塑造该领域的10篇顶尖论文（未读就是不合格的算法工程师）

第154期学生必看：12款高效学习的最佳AI工具

第153期这3款AI工具，没它们我真的不行——即刻提升工作效率

第156期适用于RAG的最佳开源嵌入模型多语言自然语言处理及阿拉伯语文本的高性能开源嵌入模型

第154期学生必看：12款高效学习的最佳AI工具