4.pycharm添加第三方库

网络爬虫的第一步就是根据URL,获取网页的HTML信息。在Python3中,可以使用urllib.request和requests进行网页爬取。
(1)准备所需库

我们需要准备一款名为BeautifulSoup(网页解析)的开源库,用于对下载的网页进行解析,我们是用的是PyCharm编译环境所以可以直接下载该开源库。

  • urllib库是python内置的,无需我们额外安装,只要安装了Python就可以使用这个库。
  • requests库是第三方库,需要我们自己安装。

第三方库安装步骤如下:
选择File->Settings

在这里插入图片描述
打开Project:PythonProject下的Project interpreter

在这里插入图片描述
点击加号添加新的库

在这里插入图片描述

输入bs4选择bs4点击Install Packge进行下载
在这里插入图片描述

小知识:requests库的github地址:https://github.com/requests/requests
步骤如下:
在cmd中,使用如下指令安装requests:
pip install requests
或者:
easy_install requests


requests常用方法

在这里插入图片描述

官方中文教程地址:
http://docs.python-requests.org/zh_CN/latest/user/quickstart.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值