爬虫简单实例

简单的数据采集

简单的运用爬虫的实例(python2.7)

1.python安装

图片名称

首先安装python是第一步,登录python的官网下载对应的安装包,默认安装即可;

2.安装python第三方包

我们需要的第三方库文件requests;

通过官网下载,或者pip安装即可,具体pip的安装方式,请点击here

3.运行爬虫实例

import requests
try:
    r=requests.get('http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html')
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except:
    print ("")

运行代码即可打印2016年最好大学排名页面的HTML内容。

4.运行结果

1148627-20170731162749349-1737743190.png

5.拓展

为了更好处理HTML文件,获取你所需要的信息,可以安装BeautifulSoup库,调用find或者findall,协同re库,更准确的获取。

转载于:https://www.cnblogs.com/azuredream/p/7263830.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值