抓取并输出到控制台
from bs4 import BeautifulSoup #解析requests请求到的HTML页面
import requests#请求目标网页
url = 'xxx' #此处 xxx 在使用时要换成对应的网址
con = requests.get(url)
con.encoding = 'utf-8'
texts = con.text
result = BeautifulSoup(texts,'lxml') #html.parser解析的库主要用于改造或提取html
div1 = result.find('div',attrs={'class':'post_body'})
print(div1.text)
本文介绍了如何使用Python的requests和BeautifulSoup库从指定URL抓取网页内容,重点在于解析'post_body'类的div元素,提取其文本信息。
511

被折叠的 条评论
为什么被折叠?



