- 博客(2)
- 收藏
- 关注
原创 网络爬虫初识
(2)增量式爬虫:在具有一定规模的网络界面集合的基础上,采用更新数据的方式选取已有集合中的过时网页进行爬取,保证所抓取到的数据与真实网络数据足够接近。(1)表层爬虫:爬取表层网页的爬虫叫做表层爬虫。网络爬虫,又称网页蜘蛛,网络机器人,是一种按照一定的规则、自动请求万维网网站并提取网络数据的程序或脚本;(2)聚焦爬虫:又称主题网络爬虫,选择性的爬取与预定主题相关的页面,极大的节省硬件和网络资源;(1)累积式爬虫:从某个时间点开始,通过遍历的方式爬取系统所允许的存储和处理的所有页面。(1)网络爬虫代替手工;
2023-10-20 16:21:32
633
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人