利用python爬取世界名牌大学排名数据_python爬虫——爬取大学排名信息

最新推荐文章于 2025-04-23 16:47:31 发布

weixin_39717825

最新推荐文章于 2025-04-23 16:47:31 发布

阅读量737

点赞数

文章标签：利用python爬取世界名牌大学排名数据

本文介绍了如何使用Python爬虫从阿凡题网站获取大学排名信息，包括大学名称、排名、标签、重点学科等，并将数据保存为json和csv格式的文件。爬虫代码简单易懂，适合初学者学习。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2. 这次爬取的网址请搜索“阿凡题”(纯技术讨论)

“阿凡题”(纯技术讨论

)

3. 在该网址选择查院校，其他都是默认

4. 这次爬取的信息主要是下图红框的内容，在浏览器开发者中，点击XHR就可以发现这个接口，接口的内容都有我们需要的信息。

5. 先构建请求头，请求头直接复制过来了

# 构建请求头

headers = {

'Accept': '*/*',

'Accept-Encoding': 'gzip, deflate',

'Accept-Language': 'zh-CN,zh;q=0.9',

'Connection': 'keep-alive',

'contentType': 'application/x-www-form-urlencoded; charset=utf-8',

'Cookie': 'cfm-major=true',

'Host': 'gaokao.afanti100.com',

'media': 'PC',

'Referer': 'http://gaokao.afanti100.com/university.html',

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.157 Safari/537.36',

'X-Requested-With': 'XMLHttpRequest',

}

6. 接下来先请求这条url，通过format方法实现对url的拼接，以此达到翻页的效果，通过查看接口的内容，发现是json格式，大学的信息在data键中的university_lst中，因此我们需要取出这个键，其中university_lst是列表。

def get_index():

page = 1

while True:

if page > 188:

break

url = 'http://gaokao.afanti100.com/api/v1/universitie

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39717825

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python爬虫练习：爬取800多所大学学校排名、星级等

Python案例分享，B站视频教程：https://space.bilibili.com/523606542

09-22

793

利用python爬取世界名牌大学排名数据_使用Python爬取最好大学网大学排名

weixin_35244067的博客

02-05

599

本文实例为大家分享了Python爬取最好大学网大学排名的具体代码，供大家参考，具体内容如下源代码：#-*-coding:utf-8-*-'''''Created on 2017年3月17日@author: lavi'''import requestsfrom bs4 import BeautifulSoupimport bs4def getHTMLText(url):try:r = request...

参与评论您还未登录，请先登录后发表或查看评论

python爬取世界大学排行榜

zhaipupu的专栏

12-29

938

Python 爬世界大学排名

weixin_66397563的博客

03-27

1710

获取世界大学排名前30名 bs4

python采集世界大学排名并作数据可视化, 来看看你的母校上榜没~

m0_72282564的博客

07-11

2102

嗨喽，大家好呀~这里是爱看美女的茜茜呐代码提供者：青灯教育-巳月下面的尽量跟我保持一致哦~不然有可能会发生报错 💕开发环境:win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车在pycharm中点击Terminal(终端) 输入安装命令选择file(文件) >>> setting(设置) >>> Project(项目) >>> python interpreter(python解释器)点击齿轮, 选择add添加pytho.

python编程-第四节-操作列表-001

04-23

1017

（开场白：想象一下你是个魔法学校的校长，现在要给100个学生点名...手动一个个喊？别开玩笑了！让我们用Python的"分身术"来解决这个难题）

2018 大数据面试

Simple 专栏

10-02

4198

大数据工程师(开发)面试 1.HBase和Hive都是基于Hadoop，为什么Hive查询起来非常慢，但HBase不是？ Hive是类SQL引擎，其查询都需要遍历整张表，跑MapReduce自然很慢，但HBase是一种NoSQL的列式数据库，基于Key/Value的存储格式，不需要像Hive一样遍历，自然在速度上，乃至写的性能上是相当之快的。相关参考文献 HIVE和HBASE区别 2.通过Jav...

Python爬虫案例：爬取世界大学排行榜，做数据可视化

aliYz的博客

02-08

2673

闲的一匹，高三生没多久就要高考了（还有四个月）也是快了，咱来看看世界大学的排行榜，采集一下，做个可视化~看看有没有你心仪的学校，嘿嘿。

python爬取大学排名信息

qq_44146952的博客

11-02

827

python爬取大学排名信息思路: 1.获取排名所在网页 2.寻找大学排名信息，并填充到相关列表中 3.将大学信息打印显示出来 import requests from bs4 import BeautifulSoup import bs4 import re import time def getHTMLText(url): //获取网页内容 try: r = re...

大学排名信息爬取

knowmore0823的博客

09-30

464

import requests from bs4 import BeautifulSoup import bs4def getHTMLText(url): try: r = requests.get(url) r.raise_for_status() r.encoding = r.apparent_encoding return

python爬虫——世界排名前1000大学

YYHao

03-13

3999

pyhton爬虫，数据处理，网页解析，requests库,数据匹配等等

Python爬虫练习：爬取软科世界大学学术排名

Python案例分享，B站视频教程：https://space.bilibili.com/523606542

10-30

3075

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理以下文章来源于云边镇，作者花花前言软科世界大学学术排名（ShanghaiRanking’s Academic Ranking of World Universities，简称ARWU）于2003年由上海交通大学世界一流大学研究中心首次发布，是世界范围内首个综合性的全球大学排名。2009年开始由软科发布并保留所有权利。软科世界大学学术排名是全球最具影响力和权威性的大学排名之一.

python爬虫世界最好大学_Python编程语言：使用网络爬虫获取大学排名

weixin_39876145的博客

11-25

280

上一篇文章，和大家分享的是如何获取信息标记的知识，这篇文章，小编要和大家分享的是使用Python网络爬虫技术来获取大学排名！当我们想要了解大学排名时，如何在杂乱的网页信息上，快速获取我们想要的大学排名信息了！这里就需要用到Python网络爬虫提取信息的技术了！大学排名的程序代码如下：清华大学#CrawUnivRankingB.pyimport requestsfrom bs4 import Bea...

python爬虫世界最好大学_Python爬虫练习：爬取800多所大学学校排名、星级等

weixin_39700215的博客

11-25

437

Python爬去最好大学排名代码

weixin_47434673的博客

04-14

1297

Python爬取最好大学排名代码：import bs4from urllib import requestfrom bs4 import BeautifulSoup’’’（）获取网站页面’’‘def getHTMLText(url): try: resp=request.urlopen(url) html_data=resp.read().decode(‘utf-8’) return html_data except: return “”’

python大学排名数据分析案例_python案例-爬取大学排名

weixin_39633171的博客

11-28

804

一个好玩的爬虫明天就要考试了，就是不想复习，就想去写代码，学习编程！2018，第一炮。技术路线：request-bs4程序结构：1.从网上获取大学排名 ：getHTMLText（）2.提取网页内容到合适的数据结构中：fillUnivList（）3.利用合适的数据结构展示爬取的结果：printUnivList（）源程序代码：import requests #导入request库import bs4...

Python爬虫实战：2023世界大学排名数据分析与可视化

gitblog_09817的博客

09-05

439

Python爬虫实战：2023世界大学排名数据分析与可视化去发现同类优质开源项目:https://gitcode.com/ 项目介绍在数据驱动的时代，掌握数据爬取、处理和可视化技术是每个技术爱好者的必备技能。本项目通过Python编写的网络爬虫工具，成功抓取了2023年世界大学的排名数据，并将其以直观的方式在网页上进行展示。无论你是初学者还是经验丰富的开发者，这个项目都能为你提供一个绝佳的实践...

python爬虫+pygal交互式可视化爬取大学QS排名

m0_61168705的博客

01-26

2221

QS大学排名爬虫和交互式可视化

python 大学排行网站全部排行数据

weixin_66397563的博客

04-01

2026

中国大学排名,中国两岸四地排名,全球体育类院系大学排行,世界大学学术排名中国最好学科排名,中国大学专业排名,世界一流学科排名