import requests
r=requests.get('网站名称')
r.status_code
print(r.status_code)
r.encoding
r.text
r.apparent_encoding
r.encoding=r.apparent_encoding
r.text
r.text [:1000] #爬取的长度
from bs4 import BeautifulSoup
demo=r.text
soup =BeautifulSoup(demo,'html.parser')
print(soup.prettify())
该博客介绍了如何使用Python的requests库获取网页内容,并利用BeautifulSoup进行HTML解析,提取关键信息。示例中展示了获取HTTP状态码、设置编码、截取爬取内容以及使用BeautifulSoup美化输出的过程。
1756

被折叠的 条评论
为什么被折叠?



