
Python 爬虫
不知缘由
人生不易 唯有努力
展开
-
python爬虫小案例_中国大学排名(2021.04.11)
加上这一篇,我已经有三篇都是写 ”中国大学排名的爬取“小案例了,那我为什么又写一遍呢?还不是之前的代码不用成功爬取数据了。那我怎么知道的呢?有网友反馈说,运行代码返回 None我运行了一下,还真是:1、进入网址,可参考的下面的步骤,找到这些信息存储的地方:2、在浏览器输入网址:https://www.shanghairanking.cn/api/pub/v1/bcur?bcur_type=11&year=20203、找出我们需要的信息4、接下来就是开...原创 2021-04-11 21:51:28 · 9568 阅读 · 54 评论 -
python爬虫小案例_全国天气网
爬取全国天气网的天气数据原创 2022-07-22 16:01:59 · 451 阅读 · 0 评论 -
python爬虫小案例_中国大学排名(2021.02.22)
之前在 2019年就爬过了,可点击查看,现在为什么又写一遍呢?引子有网友反馈说爬不了,那就更新一版目前最新的1、进入 https://www.shanghairanking.cn/rankings/bcur/202011,先按F12 查看一下,找到我们需要爬取的数据步骤如下:步骤1:从网络上获取大学排名网页内容 getHTMLText()步骤2:提取网页内容中信息到合适的数据结构 fillUnivList()步骤3:利用数据结构展示并输出结果 prin...原创 2021-02-20 21:39:45 · 912 阅读 · 6 评论 -
python爬虫小案例_中国大学排名
一、中国大学排名爬虫案例的步骤如下:步骤1:从网络上获取大学排名网页内容 getHTMLText()步骤2:提取网页内容中信息到合适的数据结构 fillUnivList()步骤3:利用数据结构展示并输出结果 printUnivList()查看http://www.zuihaodaxue.cn/zuihaodaxuepaiming2019.html的源码,部分如下:实现本...原创 2019-06-22 17:37:32 · 666 阅读 · 2 评论 -
python爬虫小案例_从豆瓣爬取《哪吒之魔童降世》的剧照
一、在豆瓣电影网爬取以下剧照保存到本地:本次案例只爬取前 5 页的剧照,先获取前五页的链接:for i in range(5): url = 'https://movie.douban.com/subject/26794435/photos?type=S&start='+str(i*30)+'&sortby=like&size=a&subtyp...原创 2019-09-08 14:12:29 · 736 阅读 · 0 评论 -
python爬虫小案例_从豆瓣爬取《哪吒之魔童降世》的短评
一、在豆瓣电影网爬取影片的短评以及相关的信息:二、参考代码import requestsfrom bs4 import BeautifulSoupimport pandas as pdurl_list = []for i in range(5): url_list.append('https://movie.douban.com/subject/26794435/c...原创 2019-09-11 20:22:29 · 714 阅读 · 0 评论 -
python爬虫小案例_从B站爬取《哪吒之魔童降世》终极预告 的弹幕
1、在 Google 浏览器 输入:https://www.bilibili.com/video/av606041932、右键,查看网页源代码 ,查找 cid :3、在 Google 浏览器 输入:https://comment.bilibili.com/105487088.xml4、弹幕数据所在的标签参数内容解读<dp="138.20700,4,25,167...原创 2019-09-09 20:06:00 · 753 阅读 · 0 评论 -
python爬虫小案例_从豆瓣爬取多页的图书信息保存到数据库(MongoDB)
一、在豆瓣网爬取以下图书的信息:二、参考代码:1、连接 MongoDB 数据库,并且创建数据库和表import pymongomyclient = pymongo.MongoClient("mongodb://127.0.0.1:27017/")db = myclient['webCrawler'] # 创建数据库 webCrawlerdatatable =...原创 2019-08-29 17:52:27 · 1410 阅读 · 0 评论