最近Hugging Face工程师Phil Schmid发布了一篇爆款教程,用Gemini 3从零开始演示:智能体本质上就是“LLM + 工具 + 循环”的组合。全程不到100行Python代码,就能实现一个能读写文件、交互对话的 CLI 智能体,全程无复杂框架!
一、先搞懂:智能体到底是什么?

🧠 智能体 = 大脑 + 手眼 + 记忆 + 生命循环
先破除迷思:智能体不是玄学,它就是个有生命的"数字员工":
大脑(Model):Gemini 3 Pro,负责思考规划
手眼(Tools):能执行的函数,如读文件、搜网页
工作记忆(Context):对话历史+工具结果,也就是上下文工程
生命循环(Loop):观察→思考→行动→观察,直到任务完成
这就是经典的ReAct模式,但用Gemini原生函数调用实现,不依赖LangGraph、CrewAI等复杂框架。
🛠️ 4步实战智能体
Step 1:最基础——纯文本生成
先做个能记住对话的聊天机器人(还不是智能体):
from google import genai
class Agent:
def __init__(self, model: str):
self.client = genai.Client()
self.contents = []
self.model = model
def run(self, contents: str):
self.contents.append({"role": "user", "parts": [{"text": contents}]})
response = self.client.models.generate_content(
model=self.model, contents=self.contents
)
self.contents.append(response.candidates[0].content)
return response
agent = Agent(model="gemini-3-pro-preview")
print(agent.run("德国最值得去的3个城市").text)
# 输出:Berlin, Munich, Cologne
这只是一个带记忆的聊天机器人,还不能行动。
Step 2:赋予手眼——加入工具
定义3个文件操作工具,用JSON Schema告诉模型"你有什么能力":
# 工具定义(模型看到的说明书)
read_file_definition = {
"name": "read_file",
"description": "读取文件内容,支持相对路径",
"parameters": {
"type": "object",
"properties": {
"file_path": {"type": "string", "description": "文件路径"}
},
"required": ["file_path"],
},
}
# 工具实现(真正执行的代码)
def read_file(file_path: str) -> dict:
with open(file_path, "r") as f:
return f.read()
# 注册工具
file_tools = {
"read_file": {"definition": read_file_definition, "function": read_file},
# ...write_file, list_dir同理
}
改造Agent类,把工具定义传给模型:
config = types.GenerateContentConfig(
tools=[types.Tool(function_declarations=[...])],
)
response = self.client.models.generate_content(..., config=config)
现在问它"列出当前目录文件",模型会返回:
[FunctionCall(name='list_dir', args={'directory_path': '.'})]
但还没完——模型叫了工具,你得真的去执行!
Step 3:闭环——让循环转起来
这是最关键的一步:拦截工具调用→执行→把结果塞回模型→继续思考。
class Agent:
def run(self, contents: str):
# 1. 发送用户消息
self.contents.append({"role": "user", "parts": [{"text": contents}]})
# 2. 调用模型
response = self.client.models.generate_content(...)
self.contents.append(response.candidates[0].content)
# 3. 检查是否要调用工具
if response.function_calls:
for tool_call in response.function_calls:
# 4. 执行工具
result = self.tools[tool_call.name]["function"](**tool_call.args)
# 5. 把结果包装成FunctionResponse
func_response = {
"functionResponse": {
"name": tool_call.name,
"response": {"result": result}
}
}
# 6. 递归调用自己,把结果传回模型
return self.run([func_response])
return response # 7. 没有工具调用,任务完成
⚠️ 关键细节:Gemini 3有Thought Signatures,必须原样保留,否则会丢失推理链!
现在智能体活了:
You: 列出当前目录文件
[Function Call] list_dir('.')
[Function Response] ['.venv', 'main.py', 'data.txt']
Linus: 当前目录有3个文件:.venv, main.py, data.txt
Step 4:CLI交互——终极形态
套个while循环,就是完整可用的命令行智能体:
agent = Agent(
model="gemini-3-pro-preview",
tools=file_tools,
system_instruction="你是一个 helpful 的编程助手,说话像Linus Torvalds"
)
while True:
user_input = input("你: ")
if user_input.lower() == 'exit':
break
response = agent.run(user_input)
print(f"Linus: {response.text}\n")
效果:你可以说"把data.txt内容改成Hello World",它会自动read_file→思考→write_file,一气呵成。
💎 工程最佳实践
Schmid特别强调:循环容易,但做好很难。以下是行业顶级实践:
1. 工具设计是门艺术
•命名要直白:用search_customer_database,别用`cust_db_v2_query
•描述要精确:这是工具的"提示工程",写清楚什么时候用、怎么用
•错误要友好:别返回50行堆栈,返回"错误:文件不存在,你是指'data.csv'吗?"
•容忍模糊输入:模型经常猜错路径,工具要能处理相对路径和模糊匹配
2. 上下文工程是性能关键
•禁止"数据倾倒":别用get_all_users()返回10MB表,用search_users(query: str)
•坚持"即时加载":模型只存文件路径/ID,需要时再调用工具拉取内容
•及时压缩:长对话要总结历史,或启动新会话
•外部记忆:复杂任务允许智能体写"草稿本",需要时再读入
3. 不要过度工程
•先榨干单智能体:Gemini 3能处理几十个工具,别急着上多智能体
•设置逃生机制:max_iterations=15,防止死循环
•硬规则护栏:用system_instruction明确"严禁退款超过50美元"
•人机协作:敏感操作(发邮件、删文件)前要求确认
4. 调试必须透明
•打印一切:工具调用、参数、结果、模型思考过程
•分析推理链:看模型为什么调这个工具,能快速定位问题
🎯 核心结论
1.智能体=LLM+循环+工具,100行代码就能跑通原
2.工具定义和上下文管理是成败关键,比框架选择重要10倍
3.先从简单循环开始,真的不够用了再考虑LangGraph/CrewAI
4.Gemini 3的原生函数调用已经足够强大,单体智能体能搞定80%场景
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套 AI 大模型突围资料包:
- ✅ 从零到一的 AI 学习路径图
- ✅ 大模型调优实战手册(附医疗/金融等大厂真实案例)
- ✅ 百度/阿里专家闭门录播课
- ✅ 大模型当下最新行业报告
- ✅ 真实大厂面试真题
- ✅ 2025 最新岗位需求图谱
所有资料 ⚡️ ,朋友们如果有需要 《AI大模型入门+进阶学习资源包》,下方扫码获取~

① 全套AI大模型应用开发视频教程
(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

② 大模型系统化学习路线
作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

③ 大模型学习书籍&文档
学习AI大模型离不开书籍文档,我精选了一系列大模型技术的书籍和学习文档(电子版),它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。

④ AI大模型最新行业报告
2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

⑤ 大模型项目实战&配套源码
学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

⑥ 大模型大厂面试真题
面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

以上资料如何领取?

为什么大家都在学大模型?
最近科技巨头英特尔宣布裁员2万人,传统岗位不断缩减,但AI相关技术岗疯狂扩招,有3-5年经验,大厂薪资就能给到50K*20薪!

不出1年,“有AI项目经验”将成为投递简历的门槛。
风口之下,与其像“温水煮青蛙”一样坐等被行业淘汰,不如先人一步,掌握AI大模型原理+应用技术+项目实操经验,“顺风”翻盘!


这些资料真的有用吗?
这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


以上全套大模型资料如何领取?

6万+

被折叠的 条评论
为什么被折叠?



