爬取最好大学排名

import requests
from bs4 import BeautifulSoup
import bs4

url = ‘http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html

ret = requests.get(url=url)

修改字符编码

ret.encoding = ret.apparent_encoding
data = ret.text

将网页文本以‘html.parser’做格式化操作

soup = BeautifulSoup(data, ‘html.parser’)

获取所有的‘tbody’标签的子标签

tr_list = soup.find(‘tbody’).children
ulist = []
for tr in tr_list:
# 判断tr是否是一个标签对象
if isinstance(tr, bs4.element.Tag):
# 拿到tr中所有的td
tds = tr(‘td’)
ulist.append([tds[0].string, tds[1].string,
tds[2].string, tds[3].string])

def print_ulist(ulist, pro):
print(“中国2019{}地区最好大学排名”.format(pro))
tplt = “{0:10}\t{1:{4}10}\t{2:10}\t{3:10}”
print(tplt.format(‘排名’,‘学校排名’,‘地区’,‘评分’,chr(12288)))
if pro == ‘浙江’:
pass
for i in range(len(ulist)):
u = ulist[i]
if u[2] == ‘浙江’:
print(tplt.format(u[0],u[1],u[2],u[3],chr(12288)))

print_ulist(ulist, ‘浙江’)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值