股票价格聚类分析:K-means与期望最大化算法的应用
1. 实验目标与数据准备
实验的目标是从2013年1月1日至12月31日期间的一组股票价格走势中提取聚类特征。为此,从标准普尔500指数列表中随机选取了127只股票。
在进行聚类之前,关键是选择合适的特征和操作的时间窗口。考虑将252个交易日的整个历史价格作为特征是合理的,但由于观测值(股票)数量有限,无法使用整个价格范围。因此,选取第80天至第130天每个交易日的股票收盘价作为观测值(SAMPLES = 50),并使用最小值和最大值对调整后的每日收盘价进行归一化。
以下是执行K-means算法的简单函数:
Val MAX_ITERS = 150
def run(K: Int, obs: DblMatrix): Unit = {
val kmeans = KMeans[Double](K, MAX_ITERS) //1
val clusters = kmeans |> XTSeries[DblVector](obs) //2
clusters.foreach( _.center.foreach( show( _ ))) //3
clusters.map( _.stdDev(XTSeries[DblVector](obs, euclidean))).
foreach( show( _ ) ) //4
}
在上述代码中,首先使用聚类数量K和最大迭代次数MAX_ITERS初始化KMeans类(第1行),这两个参数是特定于领域和问题的。然后执行聚类算法(第2行),返回一个聚类列表。接着显示每个聚类的
超级会员免费看
订阅专栏 解锁全文

10万+

被折叠的 条评论
为什么被折叠?



