
爬虫
文章平均质量分 73
RWLinno
不经常逛优快云,合作请联系我邮箱rwlinno@gmail.com,个人主页:https://rwlinno.github.io/
展开
-
爬虫学习笔记04-分布式与协程
我们需要搭建一个分布式的机群,让其对一组资源进行分布联合爬取,提升爬取数据的效率。原创 2023-06-06 13:00:00 · 811 阅读 · 0 评论 -
爬虫学习笔记03-Scrapy框架
就是一个集成了很多功能并且具有很强通用性的一个项目模板。:爬虫中封装好的一个明星框架。功能:高性能的持久化存储,异步的数据下载,高性能的数据解析,分布式。原创 2023-06-06 12:00:00 · 832 阅读 · 0 评论 -
爬虫学习笔记02-基本模块
概念:Request是python中原生的一款基于网络请求的模块。特点:功能强大,简单便捷,效率极高。作用:模拟浏览器发请求。原创 2023-06-06 11:00:00 · 889 阅读 · 0 评论 -
爬虫学习笔记01-概念
通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程。:门户网站可以通过制定相应的策略或者技术手段,防止爬虫程序进行网站数据的爬取。:爬虫程序也可以通过制定相关的策略或者技术手段,破解门户网站具备的反爬机制,从而获取门户网站的数据。:君子协议。规定网站内容中哪些可以爬取,哪些不可以被爬取。原创 2023-06-06 10:00:00 · 685 阅读 · 0 评论