python模块分类目录

最新推荐文章于 2025-11-18 14:00:53 发布

原创最新推荐文章于 2025-11-18 14:00:53 发布 · 868 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

Python 专栏收录该内容

100 篇文章

订阅专栏

本文介绍了一系列用于网站信息抓取及内容解析的Python模块，包括获取网站技术栈的builtwith，提取域名信息的whois，以及网页内容提取工具如re、beautifulsoup和lxml等。同时涉及了URL处理、系统操作及一些通用工具模块。

网站相关：

1、builtwith模块，第三方模块，可以用pip直接安装。作用：返回网站所用前后端框架，后台语言，服务器操作系统，等网站信息。

2、whois模块，第三方模块，可以pip安装。作用：返回域名的所有者，email，注册地址等等whois信息。

3、urllib、urllib2、request模块，标准库。作用：与网站服务器进行访问、回馈等交互操作。

4、urlparse模块，标准库，作用：对网址字符串进行解析、分割、组装等操作。

内容提取：

1、re模块，标准库，纯C编写，效率高。作用：用正则表达式方式提取信息。

2、beautifulsoup模块，第三方模块，可以支持lxml的解析，保持了beautifulsoup的易用性，也增快了速度，推荐使用。

作用：提取网页标签方面作用强大而简单，比正则提取网页灵活。

3、lxml模块，第三方模块，作用与beautifulsoup一致，简洁强大，支持xpath、find和css选择器等方式定位元素，c语言写的，安装麻烦，效率高。

4、json模块，作用解析json格式的内容。

系统方面：

1、os模块，标准库

2、sys模块，标准库

未分类：

1、itertools 迭代模块

2、datetime 时间模块

3、random 随机模块

4、time 时间模块

5、pyaotogui（模拟键鼠，类似按键精灵）

6、pickle模块持久性存储

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

THMAIL 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。