- 博客(13)
- 收藏
- 关注
原创 AI智能体到底是什么?几张图解帮你快速了解AI智能体
AI智能体是一种能够自主执行任务、决策和与环境互动的智能系统,其核心技术包括机器学习、自然语言处理和计算机视觉。当前,AI智能体已广泛应用于客服、医疗、金融和智能家居等领域。尽管面临数据隐私、伦理问题等技术挑战,但其未来发展潜力巨大,将朝着增强自主性、跨领域应用和人机协作方向演进。随着AI大模型迅速崛起,该领域预计2025年人才缺口达1000万,为从业者带来全新机遇。
2025-06-23 15:11:27
889
原创 万字解析!一文带你了解深度学习中经典神经网络结构--CNN、RNN、LSTM、Transformer!
本文系统介绍了深度学习中四种经典神经网络结构:CNN、RNN、LSTM和Transformer。重点剖析了CNN的卷积-池化结构在图像处理中的优势,RNN处理序列数据的时序建模能力,以及LSTM通过门控机制解决长程依赖问题的创新设计。文章通过示意图直观展示了各网络的工作原理,并列举了它们在图像分类、机器翻译等领域的实际应用案例。最后指出AI大模型领域的人才缺口,强调系统学习的重要性,为读者提供了完整的学习资源路径。全文兼顾技术深度与实用性,是了解深度学习核心架构的优质指南。
2025-06-19 15:46:33
1039
原创 AI Agent的概念、自主程度和抽象层次分别是什么?
摘要 当前AI领域对Agent的定义存在广泛分歧,主要源于概念的演变和使用场景的多样化。业界逐渐形成共识,采用"Agentic System"一词来涵盖不同自主程度的系统。从静态编排、程序动态编排到完全自主编排,系统自主性逐步提高,控制力相应减弱。设计Agent需要多层次抽象:业务适配、产品形态、流程拆解和技术实现。在销售自动化等场景中,通过合理分解子任务并选择适当的设计模式,可以有效构建AI Agent系统。
2025-06-16 11:32:15
826
原创 这份谷歌提示词指南,让你秒变Prompt高手!
摘要:提示词工程是优化AI模型输出的关键技术,通过设计清晰有效的指令提升ChatGPT等大型语言模型的表现。谷歌《提示词工程说明手册》介绍了从基础到进阶的方法:零样本/少样本提示、角色情境设定、思维链推理等技巧。最佳实践包括保持简洁、明确格式要求、使用积极指令等。掌握这些方法能显著提高AI的准确性,适用于文本处理、代码生成等多种场景,是每个AI使用者都应具备的核心能力。
2025-06-13 14:26:03
833
原创 基于 MCP 实现智能体案例架构设计
AI Agent与外部工具交互的新标准:MCP协议解析与应用 本文介绍了AI Agent与外部工具交互的最新发展——模型上下文协议(MCP)。MCP由Anthropic推出,旨在为AI与工具的交互建立统一标准,支持动态工具发现和人工干预。文章详细剖析了MCP的架构设计,包括MCP主机、客户端和服务器三大核心组件,以及它们的生命周期管理。特别以智能客服为例,展示了基于MCP的AI Agent如何调用多个内部系统,实现产品咨询、订单查询等功能。目前已有数千个MCP服务器连接GitHub、Slack等常用工具,C
2025-06-12 21:05:54
571
原创 刚刚发布的豆包大模型 1.6,直接让我少加班!还有一个视频神器超 Veo 3 登顶全球!
今年大模型竞争激烈,字节跳动持续推出多款升级模型,覆盖文本、图像、视频和语音等领域。最新发布的豆包大模型1.6系列包括综合版、深度思考版和极速版,具备256k上下文支持、多模态理解和GUI操作能力,推理能力显著提升,高考数学模拟成绩达144分。视频生成模型Seedance 1.0 pro支持多镜头切换,性价比高,1万元预算可生成2725条高清视频。此外,实时语音模型也实现全量上线,支持方言和富有表现力的语音互动。这些AI产品已深入电商、汽车、安全巡检等实际应用场景。
2025-06-11 21:49:15
1106
原创 一文读懂RAG、LangChain、Agent 到底有啥关系?
在任何大模型应用中,“知识不足”是第一堵墙。即便你的模型很强,但它本身未必知道企业自己的制度、合同、标准,也不具备最新行业法规。RAG(Retrieval-Augmented Generation)就是用来解决这个问题的。
2025-06-10 14:24:27
1153
原创 你的Agent几级?知名风投BVP定义Agent七大等级~
知名风险投资机构Bessemer Venture Partners(BVP)发布了一份关于Agent的洞察,报告中给Agent从L0到L6进行了一个划分。
2025-06-09 20:42:01
666
原创 开发者不知道的细节:一文读懂DeepSeek R1训练过程!
在本文中,我们将结合如下流程图(一张纵向展现 DeepSeek R1 训练全貌的思维导图),对训练过程中的每一个模块、每一次迭代都做深入解读,并附上关键细节,以期让读者对 DeepSeek R1 从 0 到 1、从 1 到 N 的成长路径有一个全面、清晰的认识。
2025-06-07 14:18:41
1714
原创 深入解析 Agent 与 Workflow 架构设计的差异
AI Agent 是一种具备自主意识的智能体,它能够感知环境、进行逻辑推理和决策,并实施相应动作。它可以被比作一位高效的个人助手,不仅能够执行命令,更重要的是能够理解任务的上下文、规划执行方案,并在遇到挑战时灵活地改变策略。
2025-06-06 19:23:05
834
原创 你是真的懂Transformer吗?来回答这些问题试试?
这篇文章探讨了Transformer模型的两个关键问题:训练与推理模式的区别,以及多头注意力机制中Q、K、V的分配。作者指出,真正理解Transformer的人不足10%,并通过具体案例揭示了模型的工作原理。在英译汉任务中,推理采用自回归模式(逐步生成输出),训练则使用教师强制模式(输入完整标注)。文章还解析了多头注意力中Q、K、V的来源分配,强调需要从宏观和微观两个层面掌握Transformer。最后指出初步学习应先了解整体结构,再深入组件细节。
2025-06-05 17:31:49
817
原创 字节二面拷打:训练100B模型要多少显存?
本文探讨了AI模型在GPU显存占用中的关键问题,重点分析了Transformer类大模型在训练/推理过程中的显存计算方法。文章首先介绍了显存的组成结构,包括模型参数、优化器状态、梯度值等可估算部分,以及临时变量等不可控部分。通过PyTorch示例展示了显存使用的动态变化。 核心内容围绕四大显存计算公式展开: 模型参数显存:与参数量和数据类型直接相关 优化器状态:Adam优化器需要额外存储动量等参数 梯度值:与模型数据类型一致 激活值:计算复杂度较高,需要考虑模型结构 文章还解析了并行计算策略(TP/PP/D
2025-06-04 14:13:23
853
1
原创 AI搜索+DeepResearch=?
Manus、Neo、Genspark、Lovart、II-Agent、Skywork Super Agents、MiniMax Agent、Medeo、GitHub Coding Agent、心响、AutoGLM沉思、扣子空间、问小白研报、Qbot等AI Agent不断涌现,你是不是陷入了选择困难症
2025-06-03 17:20:15
1016
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅