- 博客(8)
- 收藏
- 关注
原创 第三章 Scrapy爬虫实战(1):爬取structurae.net结构列表
转载请注明作者和出处:https://blog.youkuaiyun.com/lettmefly运行平台:WindowsPython版本:Python 3.7IDE:Pycharm目录1. 引言2. 要点3. scrapy项目编写3.1 创建项目structurae3.2 scrapy shell 分析网站3.3 编写items.py3.4 编写structure....
2018-12-23 22:30:01
333
原创 第一章 Scrapy入门
转载请注明作者和出处:https://blog.youkuaiyun.com/lettmefly运行平台:WindowsPython版本:Python 3.7IDE:Pycharm目录1. 引言2. 创建项目3. 编写Spider4. How to run our Spider5. 下一步1. 引言本章仅介绍Scrapy的基础,学习目标是:掌握创建Scrapy项目的...
2018-12-16 21:50:35
231
原创 M2增速8%处于历史地位——解读10月货币数据
图表1:M2处于历史低位事件 10月M2货币同比增长8%,前值8.3%;M1货币同比增长2.7%,前值4%。核心观点M2增速8%处于历史低位,M1增速持续下滑,货币供给增速下行压力较大。M1-M2负剪刀差持续扩大,企业现金流持续紧张。正文2018年10月金融统计数据报告10月末,广义货币(M2)余额179.56万亿元,同比增长8%,增速分别比上月末和上年同期低0...
2018-11-17 15:33:20
4120
原创 格力电器2017年应收净利润创历史新高+不分红=开盘逼近跌停!??
2018年4月25日晚,格力电器2017年报横空出世。营业收入和净利润双双创历史新高!2017年不分红!开盘逼近跌停!净利润的质量如何?对比16年净利润→经营现金流,2017年225亿净利润的质量有所下降,因为其现金流量净值仅为163亿。原因是:存货增长75亿,16年存货减少4亿;应收增加78亿,16年应收增加52亿;应付增加97亿,不足以抵消存货和应收增加153亿的负面影响。不分红的原因是??2...
2018-04-26 12:58:07
674
原创 腾讯股票数据接口
0:未知 1:名字:name 2:代码:code 3:现价:trade 4:昨收:yestclose 5:今开:open 6:成交量(手):volume 7:外盘 8:内盘 9:买一10:买一量(手)11-18:买二 买五19:卖一20:卖一量21-28:卖二 卖五29:最近逐笔成交30:时间31:涨跌:change32:涨跌幅:changepercent33:最高:high34:最低:low3...
2018-03-12 23:12:20
6728
原创 Scrapy爬虫数据入库
爬取的数据如何存储?使用数据库存储数据。数据库有许多,大至MySQL、Oracle,小至SQLite,用哪种数据库?用SQLite。使用SQLite数据库需要掌握一下知识:SQLite数据库的安装与使用;SQLite语法;Python操作SQLite数据库的方法。...
2018-02-06 22:35:30
689
原创 爬虫Scrapy一点儿笔记
在学习爬虫的过程中遇到的一些问题梳理一下。Chrom复制的XPath爬取为空在爬取某些网站时会遇到一件令人沮丧的事情。例如,爬取网易财经中贵州茅台的财务数据:scrapy shell http://quotes.money.163.com/f10/zcfzb_600519.html#01c05在Google Chrome浏览器中,选择贵州茅台2017-09-30资产负债表当中货币资金的值,并复制出...
2018-02-04 23:15:40
294
原创 Python爬虫之路
上周温习完张新民在网易公开课上讲的《企业财务报表分析》。犹记得初学时看到报表上一串串的数字,是空洞的,了无生机。温习时再看,那些数字仿佛活了,争先恐后地述说它们背后的故事。阅读财报可以是一件有趣的事情。本周偶然阅读到“他山攻石”的文章和其开发的他山石软件。我惊叹于开发者对财报获取,分析研究,可视化等的自动化和集成化。直观简明,十年四季,所有财报,鼠标点击间,统统囊括。如此阅读财报,不要太爽啊!惊叹...
2018-01-22 19:51:29
565
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人