爬虫内容回顾整理

本文介绍了HTTP请求中的GET和POST方法的区别及应用场景,并探讨了如何处理JavaScript渲染的页面内容,以有效抓取所需数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

记录一下,加深印象。。。

 

一. request

 

1. get用于获取数据,post用于提交数据

post 请求的数据会包含在 from data 里面,隐藏起来,适合一些登录页面的请求,比较安全,或者需要你输入参数进入的页面。

get 的请求直接出现在url连接中,可以直接看到,此时删除后面的参数,对网页的构造并没什么影响。

类似这种url构造,删除微博后面的一些参数,对网页吗本身没有影响。

 提交表单。

二   

 

 类似微博,发微博这个页面,或者是赶集啊58上面的一些浏览次数,都是通过js渲染过后的结果,即我所抓取下来的页面不是服务器直接发送给我的数据,而是通过浏览器渲染后的数据(html网页),

那么要解决JavaScript渲染的问题,拿到服务器直接发送给我的数据

服务器直接发送的实时数据在network里面找

 

 

mongodb  主要是键值,字典的形式,我现在主要用的是这个

转载于:https://www.cnblogs.com/ironstickagain/p/8213733.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值