
数据抓取
文章平均质量分 60
Carrie Geogre
数据分析师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Python抓取】审判信息网公开信息,导入数据库或存为文件
1.导入数据库 import requests #数据抓取模块 from parsel import Selector #标签解析模块 import pymysql #数据库模块 import html #网页解析模块 import re #正则 import json #jason模块 # 连接数据库及建表函数 def create(): connect = pymysql...原创 2020-05-03 01:45:59 · 564 阅读 · 0 评论 -
【Python】批量下载Google图片
批量下载图片是一件挺麻烦的事情,时不时会报错,包括用Paw虚拟发送指令,或者用Charles抓取APP的图片,得出来的效果也不尽人意(清晰度不够等等)。 此处介绍一个很不错的批量下载图片的跨平台工具,能在Linux, Windows 和 macOS 上运行,叫 google-images-download,跳转这个Github 项目请点击此处。 使用该工具的方法如下(以MacOS为例): 1.运行...原创 2018-11-01 10:26:45 · 5878 阅读 · 9 评论 -
【Python】链家网二手房购房决策树
链家网在售二手房房源数据抓取原创 2018-10-30 22:58:29 · 3826 阅读 · 2 评论 -
【Python】公众号APP数据抓取及分析
有时候,想了解一下感兴趣的领域,到底会有哪些专题,就想利用Python抓取微信公众号文章,分析一下。 但由于微信会定时调整网页,并严重限速,因此若抓取太快,会被封号。 近期抓取数据时,对限速的概念不太准确,导致抓取了约70条信息后,就被封号了(封号的意思是,不是公众号被封了,是但凡通过类似的headers抓取的,微信会进行标记,不允许收集数据,返回None,或无任何结果)。现今再换个微信公众号抓取...原创 2018-11-06 00:16:56 · 1650 阅读 · 0 评论 -
让人费解的统计(股票、幸福指数等)
今天在知乎,看到一篇名为“数据分析之简易分析股票走势“的文章,一开始感觉还挺有趣的。 但开篇**“谷歌和腾讯的成交量差异巨大,可能也是股价变化的一个原因“跟结尾“虽然谷歌和腾讯涨势幅度相近,但收益率相差极大“**的说辞,让人很费解: 1.请问分析股票长期价格,去单独分析具体的交易量有什么意义? 开篇截图: 股价长期价格不是由开盘价、收盘价(或由股票转让、分红等价格间接影响)而导致的吗? 难道当日...原创 2018-11-17 17:42:29 · 409 阅读 · 0 评论 -
【Python】Yahoo股票时间序列预测
1.Yahoo‘GOOG‘股票时间序列预测 (1)抓取股票数据: import pandas_datareader as data df={'谷歌':'GOOG'} start_data='2014-12-01' end_data='2018-12-01' GOOGDf=data.get_data_yahoo(df['谷歌'],start_data,end_data) # GOOGDf.head(...原创 2018-12-04 18:31:38 · 1660 阅读 · 0 评论