爬虫系列文章一(python环境安装)

     本人环境使用的是mac环境,其他环境同理,单独安装python安装以及依赖包比较麻烦一次使用Anaconda管理python环境,Anaconda是一个开源的包、环境管理器,可以用于在同一个机器上安装不同版本的软件包及其依赖,并能够在不同的环境之间切换。Anaconda包括Conda、Python以及一大堆安装好的工具包,比如:numpypandas

  • Anaconda安装
  • pycharm安装
  • 安装bs4
  • 编写第一个爬虫程序 

Anaconda安装

    1.  Anaconda下载地址:https://www.anaconda.com/distribution/#download-section,下载完成后直接安装 
    2.  创建python虚拟环境,打开终端输入 conda create -n python3.7 python=3.7 
    3. 安装完成后输入 activate python3.7。输入which python可以看到

pycharm安装

 

     pycharm 下载地址:https://www.jetbrains.com/pycharm/download/,下载完成后需要破解,破解方法见http://idea.lanyus.com/

安装bs4

    BeautifulSoup库是解析,遍历,维护“标签树”代码的功能库;名字为beautifulsoup4或bs4。

编写第一个爬虫程序

    打开python点击interpreter后面的设置图标。设置环境地址为/anaconda3/bin/python,新建工程。

 

使用BeautifulSoup编写第一个爬虫程序      

   以下代码是找出标签为h4以及class属性为widget-title的html片段

import requests
from bs4 import BeautifulSoup
r = requests.get('http://www.santostang.com/')
soup = BeautifulSoup(r.text, "lxml")
print(soup.find('h4', {'class':'widget-title'})) ##找到标签为h4 ,以及其属性为 widget-title的标签

      

    

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值