Python爬虫

urllib爬取数据

import urllib  #urllib爬虫模块

import re    #正则模块

import time #

def get = GetHtml(url):

   page = urlib.urlopen(url)

   html = page.read()

   return html

def getImg(html):

# imglist = re.findall(r'src="(.*?\.jpg)" ',html)     #返回为数组

   imglist = re.findall(r'"src=”(.*?\.(jpg|png)"',html) #返回为元组

   x= 0

   for imgurl in imglist:

      print('正在下载%s'imgurl[0])

      urllib.urlretrieve(imgurl[0],'./dowmloads/%d.jpg'%x)

      x += 1

  getImg(getHtml("url地址"))

#网址url变化 urlencode

   params = urllib.urlencode({'t':'b','w’:’word’}) #t=b&w=word

   f = urllib.urlopen('url地址%s' % params) #GET方法:urlopen(url)

   f = urllib.urlopen("url地址",parmas)    #POST方法:urlopen(url,urlencode({ "k":"b" }))

urllib2爬取数据:伪装成客户端request,服务器不会认定为爬虫

#抓取网页内容-发送报头

import urllib2

import sys

url = ""

send_headers = { #Request Headers 浏览器请求报文

   'Host’ : ‘’,

   'User-Agent’: ‘’,

   'Accept’:‘text/html’,

   'Connection’:’keep-alive’

}

req = urllib2.Resquest(url,headers = send_headers)

r = urllibs2.urlopen(req)

BeautifulSoup解析数据

import bs4

from bs4 import BeautifulSoup #导入模块

soup = BeatuifulSoup(html) #创建bs对象

soup.prettify() #格式化html标签

soup.标签名 #找标签

soup.标签.属性attrs/name  #按标签属性、名称查找

List = soup.select(标签/.class/#id/属性)  #选择器

List = soup.select("标签[id/class=value")   #组合选择器

List[index].string  #获取文字

List[index]['属性’] #获取属性
内容概要:《2024年中国城市低空经济发展指数报告》由36氪研究院发布,指出低空经济作为新质生产力的代表,已成为中国经济新的增长点。报告从发展环境、资金投入、创新能力、基础支撑和发展成效五个维度构建了综合指数评价体系,评估了全国重点城市的低空经济发展状况。北京和深圳在总指数中名列前茅,分别以91.26和84.53的得分领先,展现出强大的资金投入、创新能力和基础支撑。低空经济主要涉及无人机、eVTOL(电动垂直起降飞行器)和直升机等产品,广泛应用于农业、物流、交通、应急救援等领域。政策支持、市场需求和技术进步共同推动了低空经济的快速发展,预计到2026年市场规模将突破万亿元。 适用人群:对低空经济发展感兴趣的政策制定者、投资者、企业和研究人员。 使用场景及目标:①了解低空经济的定义、分类和发展驱动力;②掌握低空经济的主要应用场景和市场规模预测;③评估各城市在低空经济发展中的表现和潜力;④为政策制定、投资决策和企业发展提供参考依据。 其他说明:报告强调了政策监管、产业生态建设和区域融合错位的重要性,提出了加强法律法规建设、人才储备和基础设施建设等建议。低空经济正加速向网络化、智能化、规模化和集聚化方向发展,各地应找准自身比较优势,实现差异化发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值