第二天——第三方库的安装与requests模块学习
前言
在上一章我们了解到了爬虫的基本定义以及爬虫工作时的相关原理,那今天呢我们就正式进入爬虫的学习。首先要知道,Python这门语言拥有着丰富的标准库以及先辈们开发的各种功能强大的第三方库。而今天我们主要学习的呢就是关于Python中的包管理工具以及对爬虫学习过程中的第一个库requests的学习。
一、包管理工具pip
1.1 pip简介
pip是python的一个通用包管理工具,其提供了对Python包的下载、安装、查找、卸载功能。要注意的是默认情况下pip在进行下载的时候是从国外的下载源下载安装包,国内的小伙伴可能会出现下载缓慢甚至出现网络请求超时导致包下载失败的情况,所以可以把下载源切换到国内,其中常用的下载源有清华源、阿里源、华为源等。
1.2 pip指令介绍
-
install,表示安装指定的包,格式如下(以安装requests库为例):
pip install requests
-
uninstall,表示卸载指定包,格式如下:
pip uninstall xxxx(xxx为要卸载的包名)
-
show,表示查看某个已安装的包的信息
pip show xxx(要查看的包名)
-
list,以列表形式列出已安装的包
pip list
注意:该指令不用指定包,如下
-
已安装包的备份
pip freeze > path/requirements.txt
requirements.txt包含了已安装的第三方包的包名与版本号,格式如下:
path表示requirements文件要存放的路径