Hundred°C-优快云博客

原创爬取公众号文章

爬取公众号文章项目介绍页面详情完整代码输出结果项目介绍公众号是我比较喜欢的一个学习途径，经常关注一些技术文章，进行实操训练一下，因此，打算来做一期爬取公众号的文章。这里我们采用的是selenium库来通过搜狗微信网址来获取相关的文章内容：搜狗微信网址https://weixin.sogou.com/页面详情我们发现进入页面有一个登陆的按钮，如果我们不进行登陆的话，我们只能查看10个页面的内容，如果内容多的话，10页是完全不够的。这里我设置了一个20秒休眠时间，进行微信扫码登录；然后再进

2021-05-29 14:23:45 1010 4

原创基于经纬度做航线图可视化

基于经纬度画航线图介绍代码介绍这阵子在处理航空公司的数据，为了PPT展示好看，做了几个可视化图。这里用的是pyecharts第三方库。pyecharts库的相关介绍，可以上设计文档看看相关说明。https://pyecharts.org/#/zh-cn/series_options代码import pandas as pddata = pd.read_csv("airline_info.csv",encoding='gbk')print(data)#数据太多，画出来太密了，这里选了

2021-05-23 22:30:16 3113 4

原创爬取全国各地区汽车销量情况并用中国地图可视化展示

爬取全国各地区汽车销量情况并用中国地图可视化展示项目介绍网页详情代码爬取数据代码将爬取的数据保存到文档中中国地图可视化运行效果项目介绍爬取2017年全国各省份的汽车销量情况（由于数据源的问题，不包含台湾省的数据情况），并且利用 pyecharts 可视化中国地图展示。数据爬取网页链接：http://www.daas-auto.com/newsDe/892.htmlpyecharts 是Python制图一个功能非常强大的第三方库，不仅可以做简单的图表，还可以做世界地图，数据大屏等等，有兴趣的可

2021-05-06 22:00:59 5899 9

原创 selenium模拟点击爬取微博评论消息

selenium模拟点击爬取微博评论消息项目介绍selenium介绍网页详情代码爬取结果项目介绍日常在想下一期博文要写爬什么网页的内容好呢？早上看到了娱乐圈又有一个大瓜，心想那就爬爬微博的评论来看看吧！由于微博页面是动态编写的，用前面几篇文章的爬取方式显然已经不能达到爬取的要求了，因此今天将要用到selenium模拟点击来爬取动态页面的内容。selenium介绍selenium是一个强大的网页抓取工具，最初是为了网站自动化测试而开发的。近几年，它还被广泛用于获取精确的网站快照，因为网站可以直接运

2021-04-23 22:31:07 1833 3

原创爬取网易云数据并且可视化展示

结构化爬取网易云数据并且可视化展示项目说明代码框架第三方库说明内容爬取说明完整代码爬取结果内容可视化项目说明网易云音乐歌单数据获取，获取某一歌曲风格的所有歌单，进入每个歌单获取歌单名称、创建者、播放量、页面链接、收藏数、转发数、评论数、标签、介绍、收录歌曲数、部分收录歌名，并统计播放量前十的歌单，将播放量前十的歌单以及对应的所有信息进行另外存储，对其进行可视化展示。代码框架第三方库说明# bs4'''BS4全称是Beautiful Soup，它提供一些简单的、python式的函数

2021-04-15 00:08:27 22326 69

原创 Python爬取网页的所有内外链

用Python爬虫，爬取网页的所有内外链项目介绍代码大纲网站详情代码详情队列内链外链请求头完整代码爬取结果项目介绍采用广度优先搜索方法获取一个网站上的所有外链。首先，我们进入一个网页，获取网页的所有内链和外链，再分别进入内链中，获取该内链的所有内链和外链，直到访问完所有内链未知。代码大纲1、用class类定义一个队列，先进先出，队尾入队，队头出队；2、定义四个函数，分别是爬取网页外链，爬取网页内链，进入内链的函数，以及调函数；3、爬取百度图片（https://image.baidu.com/）

2021-04-07 17:23:00 15082 41

原创用Python做逐步回归

用Python做逐步回归算法介绍数据情况案例数据代码结果算法介绍逐步回归是一种线性回归模型自变量选择方法；逐步回归的基本思想是将变量逐个引入模型，每引入一个解释变量后都要进行F检验，并对已经选入的解释变量逐个进行t检验，当原来引入的解释变量由于后面解释变量的引入变得不再显著时，则将其删除。以确保每次引入新的变量之前回归方程中只包含显著性变量。这是一个反复的过程，直到既没有显著的解释变量选入回归方程，也没有不显著的解释变量从回归方程中剔除为止。以保证最后所得到的解释变量集是最优的。这里我们选择赤池信息

2021-04-04 19:28:18 11670 18

ABC12138138的博客

原创爬取公众号文章

原创基于经纬度做航线图可视化

原创爬取全国各地区汽车销量情况并用中国地图可视化展示

原创 selenium模拟点击爬取微博评论消息

原创爬取网易云数据并且可视化展示

原创 Python爬取网页的所有内外链

原创用Python做逐步回归

原创 python爬取新闻，并下载新闻中的图片

原创爬取三联生活周刊新闻（进阶版）

原创爬取三联生活周刊网站新闻

原创爬取广州天气并格式化输出

空空如也

不懂就问之如何学习鸿蒙系统啊，我也想了解一下