发布自已写的一个简单的爬虫项目xspider2

该项目介绍了一个用于网页抓取的框架,已完成单页面抓取及数据库连接功能的封装,并使用Python操作MySQL的库MySQLdb。此外,还提供了高效协议分析工具curl和PyCurl的参考。
部署运行你感兴趣的模型镜像
这个项目主要是分析一个页面的深度链接值,然后进行相应的抓取.目前已经完成了[b]单页面抓取操作方法的封装[/b]
(import graspContent.py)
以及[b]MySQL数据库连接[/b]
(import link_db.py)
.

Python操作MySQL的库是MySQLdb:
MySQLdb is the Python DB API-2.0 interface. _mysql is a low-level API similiar to the MySQL C API. ZMySQLDA is a Database Adapter for Zope2.

在[url=http://sourceforge.net/projects/mysql-python]这里[/url]可以找到更多信息和下载.

高效的协议分析可以参考[url=http://curl.haxx.se/]curl[/url],[url=http://curl.haxx.se/]PyCurl[/url]是其一个python封装.

项目放置在[img]http://code.google.com/hosting/images/code_sm.png[/img]上,采用MIT协议分发.如果有兴趣加入,可以发邮件至myctrls@gmail.com和我联系.
项目地址[url=http://code.ibd.ac.cn]http://code.ibd.ac.cn[/url]
SVN checkout:[url=https://xspider2.googlecode.com/svn/trunk/]https://xspider2.googlecode.com/svn/trunk/[/url]

最后感谢很多在我学习和实践python道路上帮忙的很多朋友们.
附图是xspider2的结构图.

您可能感兴趣的与本文相关的镜像

Yolo-v8.3

Yolo-v8.3

Yolo

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的Joseph Redmon 和Ali Farhadi 开发。 YOLO 于2015 年推出,因其高速和高精度而广受欢迎

制作一个Docker镜像的基本流程如下: 1. 编一个Dockerfile文件,Dockerfile是Docker镜像的构建文件,它包含了一系列指令,用来描述如何构建镜像。可以在Dockerfile中指定基础镜像、安装软件、配置环境变量等操作。 2. 使用docker build命令来构建镜像,该命令会根据Dockerfile文件中的指令,自动构建并打包一个新的Docker镜像。例如,使用以下命令来构建一个新的镜像: ``` docker build -t myimage . ``` 其中,`-t`参数用来指定新镜像的名称,`.`表示Dockerfile文件所在的目录。 3. 运行新的镜像,使用docker run命令来启动一个容器,并运行镜像中的应用程序。例如,使用以下命令来启动一个新容器: ``` docker run -d -p 8080:80 myimage ``` 其中,`-d`参数表示在后台运行容器,`-p`参数表示将主机的8080端口映射到容器中的80端口,`myimage`表示要运行的镜像名称。 4. 保存镜像,使用docker save命令将镜像保存成为一个tar文件,从而可以在其他机器上部署该镜像。例如,使用以下命令来保存镜像: ``` docker save myimage > myimage.tar ``` 其中,`myimage`表示要保存的镜像名称,`>`表示将输出重定向到一个文件中。 以上是Docker镜像制作的基本流程,需要注意的是,在编Dockerfile文件时,应该尽量使用最小化的基础镜像,并注意安全性和可维护性。另外,在构建和运行镜像时,应该遵循最佳实践,例如使用Docker Hub上的官方镜像、限制容器的资源使用等。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值