金融数据获取指南
在数据科学和量化金融项目中,数据收集是至关重要的一环。正所谓“垃圾进,垃圾出”,我们应尽力获取高质量的数据,并对其进行正确的预处理,以便后续使用统计和机器学习算法进行分析。因为分析结果高度依赖于输入数据,再复杂的模型也无法弥补低质量数据带来的问题。同时,在分析时,我们可以借助自身或他人对经济/金融领域的理解,来筛选合适的数据,例如用于建模股票收益。
1. 数据来源差异
不同的数据来源可能会提供不同的数据。从两个不同供应商下载的价格数据很可能存在差异,因为他们的数据来源不同,并且可能采用不同的方法对公司行为(如股票拆分)进行价格调整。最佳做法是根据网络评价等,找到你最信任的特定类型数据的来源,然后使用该来源下载所需数据。另外,在构建算法交易策略时,用于建模的数据应与执行交易时使用的实时数据保持一致。
需要注意的是,这里不涉及另类数据。另类数据可以是任何有助于预测资产价格的数据,如卫星图像、传感器数据、网络流量数据、客户评论等。虽然有许多供应商专门提供另类数据,但获取这些数据往往涉及较大的项目,超出了本文的范围。同时,在进行网页抓取时,要确保不违反网站的使用条款。
2. 可获取数据的来源
以下是一些可以获取金融数据的来源:
- 获取雅虎财经的数据
- 获取纳斯达克数据链接的数据
- 获取Intrinio的数据
- 获取Alpha Vantage的数据
- 获取CoinGecko的数据
3. 从雅虎财经获取数据
雅虎财经是最受欢迎的免费金融数据来源之一。它不仅包含不同频率(每日、每周和每月)的历史和当前股票价格,还提供计算指标(如贝
超级会员免费看
订阅专栏 解锁全文
9871

被折叠的 条评论
为什么被折叠?



