爬虫常用库的安装

请求库(requests,selenium)、解析库(beautifulsop)、存储库、工具库等

 

urelib   

re

上面这两个是python自带的库

需要自己安装额库:

(在windows下,使用pip install 命令)

requests

selenium用来驱动浏览器,做自动化测试,一些被js渲染的用这个来获取源代码

phantomjs,无界面浏览器,下载,并将phantomjs.exe配置到环境变量

lxml,可以用来进行网页的解析

------------------------------------

beautifulsoup,也是一个网页解析库,并且依赖于lxml库,在安装时需要输入pip3 install beautifulsoup4,导入时使用import bs4  

from bs4 import Beautifulsoup

-------------------------------------

 

pyquery也是一个网页解析库,比beautifulsoup更加方便

一些存储库:

pymysql

pymongo

redis

一些工具库

flask是一个web库,在做一些代理的设置是=时,可  能会用到这个库

django,一个web服务器框架

jupyter,可以理解为一个笔记本,但这个笔记本功能比较强,可以在先运行代码,很多功能,用来写代码或者文档记录很方便

在linux下,使用如下命令即可:

pip3 install requests selenium beautifulsoup4 puquery pymysql pymongo redis flask django jupyter

 

转载于:https://www.cnblogs.com/ronghe/p/9142241.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值