PYTHON网络爬虫从入门到实践第9章解决中文乱码

最新推荐文章于 2025-03-01 23:45:01 发布

原创最新推荐文章于 2025-03-01 23:45:01 发布 · 153 阅读

0 ·

CC 4.0 BY-SA版权

python 专栏收录该内容

313 篇文章

订阅专栏

111

import requests
r = requests.get('http://www.santostang.com')
print (r.request.headers)

222

import requests

link = 'http://www.santostang.com'
headers = {'User-Agent' : 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'} 
r = requests.get(link, headers= headers)
print (r.request.headers)

在这里插入图片描述
A — 65

在这里插入图片描述

import requests
from bs4 import BeautifulSoup
headers = {'User-Agent' : 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}

url = 'http://w3school.com.cn/'

r = requests.get(url, headers = headers)
r.encoding ='gbk'
soup = BeautifulSoup(r.text, "lxml")
xx = soup.find('div',id='d1').h2.text
print (xx)

在这里插入图片描述