长假回来,大家应该很累吧?今天股市大涨,希望炒股的同学十月里能挖掘到好机会!
上次在园子里发布《》后,有同学问我怎么获取股票数据,我搜了下园子里的文章,写这么方面的挺多,比如下面两篇:
今天把数据抽取的代码整理了下,做了个控制台程序,这个程序主要抓取了新浪网的行业数据、股票信息,股价日、周、月线的数据,并把数据存储到数据库。文章末尾提供代码下载网址,代码可运行,设置好数据库连接字符串后,即可抽取数据了。
数据抽取主要是找到合适的数据源,分析和提取数据。
一、数据源
免费的接口主要是各大门户网站和财经类网站,比如新浪网易的财经频道,或者东方财富和和讯网站等。
专门做接口的数据聚合网站 API.CN,付费的有聚合数据股票接口等。
另外如果想了解各种指数的成分股,比如上证50,深户300等指数的成分股,可以参考
二、分析和提取数据
通过浏览器的F12或者Fiddler查看网络请求数据,数据最好返回的是json格式,json格式的数据非常容易提取,利用Newtonsoft.Json把json对象转换成dynamic对象,访问json数据真是方便极了,没有用dynamic对象之前,一直是建立和json对象一致的类,然后在反序列化,现在不需要了,代码示例如下: