大家好,现在 AI 智能体在处理复杂推理任务上越来越强大。Smolagents作为Hugging Face 开发的轻量级框架,能让大语言模型(LLMs)与现实数据处理无缝对接。DeepSeek-R1 是开源大语言模型里的 “性价比担当”,用 Ollama 部署到本地,运行效率超高。借助这两个智能框架,结合网页抓取和数据导出工具,搭建超厉害的推理智能体。
1.Smolagents:轻量高效的智能体框架
Smolagents是个极简风格的AI智能体框架,专为开发者高效构建、部署智能体而生。
Smolagents在关键特性上十分出众,代码库约1000行,开发起来比较简单,并且能执行Python代码片段,结果更精准。在沙盒环境运行代码,同时支持很多大语言模型,例如Hugging Face系和OpenAI的GPT,工具共享也很方便,能从Hugging Face Hub共享、导入工具。
其具有很多优势,嵌套函数调用,复杂逻辑也能轻松表达;比起JSON,对象管理流程大幅简化;不管哪种计算操作,都能运用。
2.DeepSeek-R1:开源界的“潜力股”大模型
DeepSeek-R1是DeepSeek AI开发的开源大语言模型,优点很多:
-
性价比超高:花更少的成本,就能获得先进的推理能力。
-
文本处理高效:处理文本任务效率一流。
-
百搭框架集成:和Smolagents这类智能体框架能完美集成。
3.实战:构建超实用推理智能体
带大家实操一波,用Smolagents和DeepSeek-R1打造一个超实用的推理智能体。这个智能体有三大厉害功能:
-
数据抓取:能从realtor.com网站精准抓取房地产经纪人数据,轻松获取一手信息。
-
数据存储:抓取完的数据,会自动保存到CSV文件里,方便后续整理和分析。
-
推理任务执行:借助DeepSeek-R1强大的能力,执行各种推理任务,挖掘数据背后的价值。
(1)导入所需库
from typing import Optional, Dict
from smolagents import CodeAgent, tool, LiteLLMModel , GradioUI, OpenAIServerModel
import requests
import os
import time
from bs4 import BeautifulSoup
import pandas as pd
Smolagents模块: - CodeAgent:定义和管理人工智能智能体。 - tool:用于定义智能体工具的装饰器。 - LiteLLMModel:集成各种大语言模型。 - OpenAIServerModel:连接外部模型。
其他库: - requests:用于发送HTTP请求。 - BeautifulSoup:解析HTML,用于网页抓取。 - pandas:处理结构化数据。
(2)网页抓取工具
@tool
def scrape_real_estate_agents(state: str, city_name: str, num_pages: Optional[int] = 2) -> Dict[str, any]:
"""Scrapes realtor.com for real estate agent information in specified city and state
Args:
state: State abbreviation (e.g., 'CA', 'NY')
city_name: City name with hyphens instead of spaces (e.g., 'buffalo')
num_pages: Number of pages to scrape (default: 2)
"""
try:
# Initialize results
agent_names = [] # Names
agent_phones = [] # Phone numbers
agent_offices = [] # Office names
pages_scraped = 0
# Set up headers
headers = {
&

最低0.47元/天 解锁文章
280

被折叠的 条评论
为什么被折叠?



