
爬虫
文章平均质量分 50
纯洁的小魔鬼
只有风暴才能击倒大树
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python操作鼠标键盘和爬虫
pyautogui是一个Python自动化库,可用于控制鼠标键盘操作。文章介绍了其核心功能:获取屏幕尺寸、移动/点击鼠标、键盘输入、截图等,并提供了代码示例。重点讲解了基于图像识别的自动化操作,包括定位屏幕元素、设置匹配精度和区域搜索。最后展示了一个爬虫案例,通过模拟翻页和另存为操作批量保存网页图片。该库适合处理重复性GUI操作,但需要注意图像匹配精度和操作延迟问题。原创 2024-05-15 17:26:07 · 1900 阅读 · 1 评论 -
ts视频文件的爬取与合并
本文介绍了两种处理TS视频文件的方法:1) 使用Python爬取TS视频片段文件,通过分析文件名规律批量下载;2) 将下载的多个TS文件合并为一个完整视频。爬取部分通过URL规律自动生成文件名并下载,合并部分则按文件名数字排序后逐个读取内容并写入新文件。两段代码都实现了自动化处理,适用于需要批量下载和合并TS视频流的场景。原创 2021-08-04 10:34:38 · 6539 阅读 · 1 评论 -
BeautifulSoup网页解析器
本文介绍了使用Python进行网页抓取和解析的方法。首先通过urllib2模块获取网页源码,支持超时设置和失败重试机制。然后利用BeautifulSoup库进行HTML解析,支持html.parser和lxml两种解析器。文章详细讲解了BeautifulSoup生成的四种对象:Tag、NavigableString、BeautifulSoup和Comment,并介绍了节点遍历方法,包括获取子节点、父节点和文本内容。最后重点讲解了节点搜索方法,如find_all()和find(),支持按标签名、类名、正则表达原创 2019-05-26 02:48:39 · 3407 阅读 · 0 评论