python--爬取网站

最新推荐文章于 2025-11-06 11:25:26 发布

原创最新推荐文章于 2025-11-06 11:25:26 发布 · 538 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python

python 专栏收录该内容

19 篇文章

订阅专栏

该博客介绍了如何使用Python的requests库获取网页内容，并利用BeautifulSoup进行HTML解析，提取关键信息。示例中展示了获取HTTP状态码、设置编码、截取爬取内容以及使用BeautifulSoup美化输出的过程。

import requests
r=requests.get('网站名称')
r.status_code
print(r.status_code)
r.encoding
r.text
r.apparent_encoding
r.encoding=r.apparent_encoding
r.text
r.text [:1000] #爬取的长度
from bs4 import BeautifulSoup
demo=r.text
soup =BeautifulSoup(demo,'html.parser')
print(soup.prettify())