爬虫糗事百科案例
提示:爬取笑话讲给女朋友,这是属于我们爬虫爱好者的浪漫
前言
随着python语言的不断发展,爬虫这门技术也越来越重要,很多人都开启了自己的爬虫之路,本文就介绍了爬虫的功能。跟着我带你走进爬虫的大门
提示:以下是本篇文章正文内容,下面案例可供参考
一、为什么学爬虫
爬虫是可以有规则的提取html的内容,获取到我们需要的对象,爬虫的高效和简单让我们爬虫爱好者更加喜欢它
二、爬虫开始
1.引入库
代码如下(示例):
import requests
import re
from lxml import etree
import json
2.获取网页
代码如下(示例):
def get_html(url):
#进行头部伪装,让浏览器认为是浏览器访问
headers = {
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36"
}
res = requests.get(url