程序员如何自己开发一个Agent？（保姆级实操指南）

原创已于 2026-01-06 15:05:13 修改 · 958 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能

于 2026-01-06 15:04:06 首次发布

人工智能专栏收录该内容

100 篇文章

订阅专栏

朋友，可以转载，但请注明出处，谢谢！
http://blog.youkuaiyun.com/jiangjunshow

作为老程序员，咱开发Agent不用从零造轮子，核心是“搭骨架+填大脑+连手脚” —— 骨架是任务调度逻辑，大脑是大模型，手脚是工具调用能力。下面分3个版本讲，从新手能跑的极简版，到能落地的进阶版，全是干货！

一、核心原理：Agent的3大必备模块

不管啥Agent，本质都绕不开这3件事，缺一个就玩不转：

规划模块：把用户的模糊需求拆成具体步骤（比如“写一篇AI绘画教程”拆成“选题→查资料→写大纲→填内容→排版”），大模型的思维链（CoT）就能搞定。
执行模块：调用外部工具干活（比如用Python爬资料、调Stable Diffusion API生成配图、用Markdown渲染排版），核心是工具函数的封装和参数传递。
反馈模块：检查执行结果对不对、好不好，不行就返工（比如发现教程里的参数写错了，让模型重新查资料修正），可以用大模型自检，也能加人工规则。

二、版本1：新手友好·极简版Agent（半天就能跑）

目标：做一个能“自动写Python小脚本”的Agent，不用复杂框架，纯原生代码+开源大模型。
技术栈：Python + Ollama（本地跑大模型，不用API key） + 简单函数封装

步骤1：环境准备

装Ollama：官网下载，一行命令跑起Llama 3。
装依赖

pip install requests ollama

步骤2：写核心代码（不到50行）

import ollama

# 1. 规划函数：让大模型拆任务
def plan_task(user_req):
    prompt = f"""你是一个Python助手，帮我把需求拆成具体的代码编写步骤。
    需求：{user_req}
    要求：步骤要清晰，每步只做一件事，比如“1. 导入需要的库；2. 定义函数XXX”
    """
    response = ollama.chat(model='llama3', messages=[{'role': 'user', 'content': prompt}])
    return response['message']['content']

# 2. 执行函数：让大模型生成代码，本地运行（只跑无风险代码）
def execute_code(code):
    try:
        exec(code, globals())
        return "代码执行成功！"
    except Exception as e:
        return f"代码报错：{str(e)}，请修正！"

# 3. 主循环：规划→执行→反馈
def simple_agent(user_req):
    print("=== 1. 任务规划 ===")
    steps = plan_task(user_req)
    print(steps)
    
    print("\n=== 2. 生成并执行代码 ===")
    code_prompt = f"""根据下面的步骤，生成完整的Python代码：
    步骤：{steps}
    要求：代码简洁，加注释，能直接运行
    """
    code = ollama.chat(model='llama3', messages=[{'role': 'user', 'content': code_prompt}])['message']['content']
    print("生成的代码：\n", code)
    
    result = execute_code(code.replace("```python", "").replace("```", ""))
    print("执行结果：", result)

# 测试一下！
if __name__ == "__main__":
    simple_agent("写一个函数，计算1到100的和，然后打印结果")

步骤3：运行测试

直接跑脚本，你会看到Agent先输出步骤，再生成代码，最后执行出结果 —— 一个极简Agent就成了！

缺点：只能跑简单代码，没有复杂工具调用，也不会自动修正错误。

三、版本2：进阶版·能调用工具的Agent（落地级）

目标：做一个能“爬取网页+数据分析+生成报告”的多工具Agent。
核心升级：引入工具注册表、标准化函数调用、结果反馈机制。
技术栈：Python + LangChain（简化工具调用） + 大模型（GPT-4/文心一言/Ollama） + 浏览器/Excel工具

核心步骤

封装工具函数：把常用功能写成标准化函数，比如爬网页、算数据、画图表

from langchain.tools import tool

@tool
def crawl_webpage(url: str) -> str:
    """爬取指定URL的网页文本内容，用于获取外部数据"""
    import requests
    from bs4 import BeautifulSoup
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    return soup.get_text()[:1000]  # 只取前1000字，避免太长

@tool
def analyze_data(data: list) -> str:
    """分析数字列表，返回平均值、最大值、最小值"""
    avg = sum(data)/len(data)
    max_val = max(data)
    min_val = min(data)
    return f"平均值：{avg}，最大值：{max_val}，最小值：{min_val}"

用LangChain搭Agent骨架：LangChain已经帮我们封装了“规划-执行-反馈”的逻辑，直接调包

from langchain.agents import create_openai_tools_agent, AgentExecutor
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from langchain import hub

# 初始化大模型（本地用Ollama的话，换LangChain的Ollama封装就行）
llm = ChatOpenAI(model="gpt-3.5-turbo")

# 加载工具
tools = [crawl_webpage, analyze_data]

# 用LangChain Hub的现成Prompt模板，省得自己写
prompt = hub.pull("hwchase17/openai-tools-agent")

# 创建Agent和执行器
agent = create_openai_tools_agent(llm, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# 测试：爬取某网站数据并分析
result = agent_executor.invoke({"input": "爬取https://xxx.com的房价数据，提取数字列表并分析"})
print(result["output"])

加反馈修正机制：如果执行失败（比如爬取失败），让Agent自动重试

# 在AgentExecutor里加参数
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True, handle_parsing_errors="重新尝试")

关键亮点

工具调用标准化：用@tool装饰器，大模型能自动识别函数名和参数。
支持多工具组合：比如爬数据→分析→生成报告，一键完成。
可扩展性强：想加新工具（比如调Stable Diffusion画图），直接封装函数就行。

四、版本3：大佬版·自主进化的Agent（工业级）

如果想做更牛的Agent（比如像Manus那样能动态调整任务、多Agent协作），需要加这些高级特性：

长期记忆模块：用向量数据库（比如Pinecone、Chroma）存储Agent的历史任务和经验，下次遇到类似需求不用重新规划。
多Agent协作：让多个小Agent分工（比如一个负责爬数据，一个负责分析，一个负责写报告），用消息队列（比如RabbitMQ）通信。
沙箱环境：执行代码或调用外部工具时，用Docker隔离，避免风险（比如防止Agent执行恶意代码）。
性能优化：用大模型的函数调用API（比如GPT-4的Function Call）代替Prompt解析，准确率更高；加缓存机制，重复任务不用重新跑。

五、避坑指南：老程序员踩过的3个坑

别自己写大模型：除非你有上亿级算力，否则直接用开源模型或API，把精力放在Agent的逻辑上。
工具调用别太复杂：新手先从2-3个工具开始，工具越多，大模型越容易搞混参数。
防住大模型幻觉：执行关键任务（比如数据分析）时，一定要加人工校验或规则校验，别完全信AI的结果。

六、快速上手路线图（7天搞定）

Day1：理解Agent核心原理，跑通版本1的极简代码。
Day2-3：学LangChain的工具调用，搭建版本2的多工具Agent。
Day4-5：加向量数据库，实现长期记忆。
Day6-7：测试优化，解决报错和幻觉问题，部署成API服务。