爬虫系列
文章平均质量分 59
大数据专业的小沉
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
正则表达式
正则表达式(Regular Expression,简称 regex 或 regexp)是一种用于描述字符串模式的工具。它可以用来搜索、匹配、替换和解析文本,广泛应用于编程、文本处理和数据验证等场景。本文将罗列与python爬虫密切相关的用法。原创 2024-10-25 11:17:05 · 874 阅读 · 0 评论 -
DrissionPage实战批量获取某东某产品评论
原本是想用selenium来爬取某电商的评论,奈何在配置完UA、cookie和token之后依旧无法看到需要的数据,群友推荐用DrissionPage,在了解之后发现上手很简单,也顺利获取到了想要的数据。原创 2024-10-25 11:55:34 · 1308 阅读 · 0 评论 -
基于Drissionpage实现的b站评论爬取(无需逆向25/2/10可用)
Drissionpage库,这是一种基于 Selenium 和 Requests 的高层次网页抓取工具,支持异步请求和网络流监听。用户可以根据需要调整爬取的页面数量和保存的文件名,以满足特定的需求。本文中的代码主要功能是从指定的 B 站视频链接中提取评论,并将其保存到一个文本文件中。用户可以指定需要爬取的页面次数以及保存的文件名。原创 2025-02-10 16:40:57 · 1179 阅读 · 0 评论
分享