
python
文章平均质量分 70
switch_swq
这个作者很懒,什么都没留下…
展开
-
优快云博客导出为Hexo的MD文件
一.获取所有文章地址、 二.使用脚本进行采集。原创 2025-02-08 13:12:10 · 294 阅读 · 0 评论 -
python爬虫学习笔记
用requests库爬取时网页可能加载不完整,故用selenium库,加sleep延时使加载充分。配置selenium库,下载chomedriver,网上有教程。更改range函数的范围就可以对该范围内用户信息爬取。学习xpath、scrapy爬虫框架、线程池等。主要利用re库,利用正则表达式提取html文件中的信息。结论:显然,-SWQ-在一定范围内粉丝最多。threading是多线程运行,节省时间。丁嘉丽12334 0。原创 2023-03-17 22:22:06 · 154 阅读 · 0 评论