以下是一个关于“用10行代码实现一个爬虫”的示例代码,适合Python初学者学习。这个简单的爬虫将使用Python的 requests 库和 BeautifulSoup 库来抓取网页内容并提取特定信息。
示例代码
import requests
from bs4 import BeautifulSoup
# 目标网页
url = "https://example.com"
# 发送HTTP请求
response = requests.get(url)
# 检查请求是否成功
if response.status_code == 200:
# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 提取网页标题
title = soup.find('title').get_text()
print("网页标题:", title)
# 提取所有段落文本
paragraphs = soup.find_all('p')
for p in paragraphs:
print(p.get_text())
else:
print("请求失败,状态码:", response.status_code)
代码说明1. 导入库:• requests :用于发