
爬虫
Bing@DBA
专注于数据库和自动化领域的工程师
展开
-
Python爬虫:春招在即你准备好租房了吗?
一、前言最近在做一个数据分析的项目主要讨论招聘市场和Python语言的就业环境以及租房,已经完成,但现在还不能公开,租房分析时需要数据,所以今天先把租房爬虫代码分享给大家!二、源码目标网站:房天下注意事项:如果直接使用 requests 发送请求但话,是得不到想要的数据,网站会自动跳转,所以我们需要先提取真正的地址,然后再向真正网址发送请求然后解析数据即可使用介绍:首先我们先...原创 2020-03-29 20:15:19 · 400 阅读 · 4 评论 -
Python爬取冠状病毒“谣言”新闻进行数据分析
一、前言今天给大家介绍的爬虫项目是爬取冠状病毒谣言数据,因为最近网络上有很多关于冠状病毒的谣言,官方也积极的出来辟谣,作为一名数据爱好者,我也想尽自己一份微薄之力,分享一些有用的数据分享,希望大家在特殊情况下能明辨是非,保护好自己和家人!二、爬取数据话不多说了,直接上代码( copy即可用 )import requestsimport pandas as pdclass Sp...原创 2020-02-14 21:16:18 · 6676 阅读 · 8 评论 -
Python新型冠状病毒疫情数据自动爬取+统计+发送报告+数据屏幕(四)数据屏幕
今天介绍给大家的是:如果使用 Python 制作数据屏幕,将从最基础的开始,如果熟悉 django 和 Python 的朋友可直接跳过项目功能设计:定时爬取疫情数据存入Mysql(爬虫篇)进行数据分析制作疫情报告(统计篇)使用itchat给亲人朋友发送分析报告(发送篇)基于Django做数据屏幕(本文)一、项目效果展示二、项目环境介绍如下是项目需要使用的第三方模块,例如...原创 2020-06-10 21:01:49 · 5014 阅读 · 174 评论 -
Python新型冠状病毒疫情数据自动爬取+统计+发送报告+数据屏幕(三)发送篇
今天介绍的项目是使用 Itchat 发送统计报告项目功能设计:定时爬取疫情数据存入Mysql进行数据分析制作疫情报告使用itchat给亲人朋友发送分析报告基于Django做数据屏幕使用Tableau做数据分析来看看最终效果目前已经完成,预计2月12日前更新使用 itchat 发送数据统计报告itchat 是一个基于 web微信的一个框架,但微信官方并不允许使用这...原创 2020-02-12 20:33:07 · 15315 阅读 · 29 评论 -
Python爬取新型冠状病毒新闻进行LDA主题分析-从概率的角度去看文学
为疫区人民祈福,向医护人员致敬!Hello大家好!我是 Fantasy!今天要给大家介绍到项目是爬取疫情新闻,然后进行分析,项目的功能具体如下:爬取疫情新闻进行词频统计绘制词云图进行LDA主题分析一、爬取疫情新闻过程展示大概需要几首歌的时间~数据展示源码解析我们这次的目标网站是 人民网首先导入我们需要的库import timeimport randomim...原创 2020-02-08 18:40:28 · 5356 阅读 · 24 评论 -
Python新型冠状病毒疫情数据自动爬取+统计+发送报告+数据屏幕(一)爬虫篇
一切来不的猝不及防一个半月前,武汉还是那个纵横江湖、肆意人间的武汉。165条江河日夜奔流,100多种不重样的过早热气蒸腾,两江四岸13千米长的沿江灯光秀将889个楼宇依次点亮,灯影重重、觥筹交错。武汉从来不缺人间烟火,而今天,毫无疑问,武汉人——以及更多的人正在陪伴武汉度过它的关键时刻 !项目功能设计:定时爬取疫情数据存入Mysql进行数据分析使用itchat给亲人朋友发生分析报...原创 2020-02-01 12:05:15 · 8232 阅读 · 25 评论 -
Python爬虫-爬取新闻网站,将数据对比去重插入数据库
一、近期想实现一个推荐系统的API,目前正在筹备中,实现了一个新闻网站,用来做测试(大家可以看我以前的文章)今天分享的就是为我的新闻网站提供数据的爬虫代码先看效果检测到重复数据时程序是不会插入到数据库中的二、实现思路获取数据库以经存在的数据提取末位30每次爬取数据只爬页面前30条数据在爬取过程中做一个简单的对比(title)三、源码import datetimeimp...原创 2019-11-29 08:17:09 · 2754 阅读 · 5 评论 -
Python爬取全国最新房价信息保存为CSV文件,进行简单的数据分析
一、 使用Python爬取房价信息1.话不多说先看代码from bs4 import BeautifulSoupimport requestsclass SpiderHours(object): def __init__(self): self.url = "http://www.creprice.cn/rank/cityforsale.html" ...原创 2019-07-09 19:37:56 · 4664 阅读 · 4 评论