
PYTHON 爬虫
文章平均质量分 82
太阳的影子wing
这个作者很懒,什么都没留下…
展开
-
【parsel】------- PYTHON爬虫基础4
parsel 这个库可以对 HTML 和 XML 进行解析,并支持使用 XPath 和 CSS Selector 对内容进行提取和修改,同时它还融合了正则表达式提取的功能。原创 2023-05-30 23:38:15 · 1166 阅读 · 1 评论 -
【response】------- PYTHON爬虫基础3
上一小节介绍了发送请求requests的基本用法。网站请求成功以后,会返回对应响应,这节我们具体介绍响应response的用法。原创 2023-03-20 19:35:37 · 918 阅读 · 0 评论 -
【requests】------- PYTHON爬虫基础2
假如我们想爬取某个公开的网页,那么第一步是什么呢?没错,和该网站建立连接,request中文是请求的意思,即获取请求头数据,问网站:我可以访问你吗?response翻译为响应,如果回应为:可以。那我们才可以开始进行爬虫的后续操作,所以我们这里介绍request的使用方法!!!原创 2023-03-20 17:02:40 · 6176 阅读 · 0 评论 -
【re正则表达式】------- PYTHON爬虫基础1
re正则表达式是对字符串操作的一种逻辑公式,在爬虫中不可避免被用到。文章开始之前先推荐一个在线正则表达式测试链接(https://tool.oschina.net/regex ),我们在爬虫过程中可以用它来先做测试。接着介绍了基础的正则表达式,并给出了匹配的具体函数及其示例,包括:re.match,re.search,re.findall,re.sub,re,compile。最后给出了几个网页爬虫提取信息的实例。原创 2023-03-14 16:38:36 · 186 阅读 · 2 评论