Python爬虫|全国补充耕地项目数量爬取与分析——多进程案例

一、使用的库

import requests
from lxml import etree
import time
import random
import re
import openpyxl
import openpyxl
from pyecharts.charts import Bar, Pie
from pyecharts import options as opts
from multiprocessing.dummy import Pool

二、数据爬取思路

1.网站地址分析

自然资源部官方网站上【补充耕地项目与地块信息公开】模块里面有全国补充耕地项目信息,主页地址为:http://bcgd.mnr.gov.cn/。点击不同的省份按钮,会自动跳转到对应省份项目清单。

在浏览器中右击检查,分析网站结构发现,省份信息包含在一个无序列表ul标签中,里面每个省份的链接地址与名称信息包含在一个li标签中,基于XPath语法很容易即可得到每个省份对应url地址。需要注意的是,第一个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

遥感与地理信息

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值