ChigoStar-优快云博客

原创第三章 Scrapy爬虫实战（1）：爬取structurae.net结构列表

转载请注明作者和出处：https://blog.youkuaiyun.com/lettmefly运行平台：WindowsPython版本：Python 3.7IDE：Pycharm目录1. 引言2. 要点3. scrapy项目编写3.1 创建项目structurae3.2 scrapy shell 分析网站3.3 编写items.py3.4 编写structure....

2018-12-23 22:30:01 368

原创第一章 Scrapy入门

转载请注明作者和出处：https://blog.youkuaiyun.com/lettmefly运行平台：WindowsPython版本：Python 3.7IDE：Pycharm目录1. 引言2. 创建项目3. 编写Spider4. How to run our Spider5. 下一步1. 引言本章仅介绍Scrapy的基础，学习目标是：掌握创建Scrapy项目的...

2018-12-16 21:50:35 243

原创 M2增速8%处于历史地位——解读10月货币数据

图表1：M2处于历史低位事件 10月M2货币同比增长8%，前值8.3%；M1货币同比增长2.7%，前值4%。核心观点M2增速8%处于历史低位，M1增速持续下滑，货币供给增速下行压力较大。M1-M2负剪刀差持续扩大，企业现金流持续紧张。正文2018年10月金融统计数据报告10月末，广义货币(M2)余额179.56万亿元,同比增长8%，增速分别比上月末和上年同期低0...

2018-11-17 15:33:20 4208

原创格力电器2017年应收净利润创历史新高+不分红=开盘逼近跌停！？？

2018年4月25日晚，格力电器2017年报横空出世。营业收入和净利润双双创历史新高！2017年不分红！开盘逼近跌停！净利润的质量如何？对比16年净利润→经营现金流，2017年225亿净利润的质量有所下降，因为其现金流量净值仅为163亿。原因是：存货增长75亿，16年存货减少4亿；应收增加78亿，16年应收增加52亿；应付增加97亿，不足以抵消存货和应收增加153亿的负面影响。不分红的原因是？？2...

2018-04-26 12:58:07 695

原创腾讯股票数据接口

0：未知 1：名字：name 2：代码：code 3：现价：trade 4：昨收：yestclose 5：今开：open 6：成交量（手）：volume 7：外盘 8：内盘 9：买一10：买一量（手）11-18：买二买五19：卖一20：卖一量21-28：卖二卖五29：最近逐笔成交30：时间31：涨跌：change32：涨跌幅：changepercent33：最高：high34：最低：low3...

2018-03-12 23:12:20 6827

原创 Scrapy爬虫数据入库

爬取的数据如何存储？使用数据库存储数据。数据库有许多，大至MySQL、Oracle，小至SQLite，用哪种数据库？用SQLite。使用SQLite数据库需要掌握一下知识：SQLite数据库的安装与使用；SQLite语法；Python操作SQLite数据库的方法。...

2018-02-06 22:35:30 702

原创爬虫Scrapy一点儿笔记

在学习爬虫的过程中遇到的一些问题梳理一下。Chrom复制的XPath爬取为空在爬取某些网站时会遇到一件令人沮丧的事情。例如，爬取网易财经中贵州茅台的财务数据：scrapy shell http://quotes.money.163.com/f10/zcfzb_600519.html#01c05在Google Chrome浏览器中，选择贵州茅台2017-09-30资产负债表当中货币资金的值，并复制出...

2018-02-04 23:15:40 305

原创 Python爬虫之路

上周温习完张新民在网易公开课上讲的《企业财务报表分析》。犹记得初学时看到报表上一串串的数字，是空洞的，了无生机。温习时再看，那些数字仿佛活了，争先恐后地述说它们背后的故事。阅读财报可以是一件有趣的事情。本周偶然阅读到“他山攻石”的文章和其开发的他山石软件。我惊叹于开发者对财报获取，分析研究，可视化等的自动化和集成化。直观简明，十年四季，所有财报，鼠标点击间，统统囊括。如此阅读财报，不要太爽啊！惊叹...

2018-01-22 19:51:29 591

lettmefly的博客