10个Python爬虫入门实例,建议收藏!!

本文介绍了使用Python的requests库进行网页爬取的基础操作,包括GET和POST请求,参数传递,处理编码,模拟浏览器避免反爬机制,以及如何保存爬取的HTML内容和图片到本地。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 爬取强大的BD页面,打印页面信息

# 第一个爬虫示例,爬取百度页面  
  
import requests #导入爬虫的库,不然调用不了爬虫的函数  
  
response = requests.get("http://www.baidu.com")  #生成一个response对象  
  
response.encoding = response.apparent_encoding #设置编码格式  
  
print("状态码:"+ str( response.status_code ) ) #打印状态码  
  
print(response.text)#输出爬取的信息

2.常用方法之get方法实例,下面还有传参实例

# 第二个get方法实例  
  
import requests #先导入爬虫的库,不然调用不了爬虫的函数  
  
response = requests.get("http://httpbin.org/get")  #get方法  
  
print( response.status_code ) #状态码  
  
print( response.text )  

3.常用方法之post方法实例,下面还有传参实例

# 第三个 post方法实例  
  
import requests #先导入爬虫的库,不然调用不了爬虫的函数  
  
response = requests.post("http://httpbin.org/post")  #post方法访问  
  
print( response.status_code ) #状态码  
  
print( response.text )  

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值