47、股票价格聚类分析：K-means与期望最大化算法的应用

Mars5

于 2025-09-01 10:17:52 发布

阅读量34

点赞数

CC 4.0 BY-SA版权

分类专栏： Scala数据科学实战指南文章标签： K-means 期望最大化算法股票价格聚类

本文链接：https://blog.youkuaiyun.com/mars5/article/details/152122715

Scala数据科学实战指南专栏收录该内容

72 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

股票价格聚类分析：K-means与期望最大化算法的应用

1. 实验目标与数据准备

实验的目标是从2013年1月1日至12月31日期间的一组股票价格走势中提取聚类特征。为此，从标准普尔500指数列表中随机选取了127只股票。

在进行聚类之前，关键是选择合适的特征和操作的时间窗口。考虑将252个交易日的整个历史价格作为特征是合理的，但由于观测值（股票）数量有限，无法使用整个价格范围。因此，选取第80天至第130天每个交易日的股票收盘价作为观测值（SAMPLES = 50），并使用最小值和最大值对调整后的每日收盘价进行归一化。

以下是执行K-means算法的简单函数：

Val MAX_ITERS = 150
def run(K: Int, obs: DblMatrix): Unit = {
  val kmeans = KMeans[Double](K, MAX_ITERS) //1
  val clusters = kmeans |> XTSeries[DblVector](obs) //2
  clusters.foreach( _.center.foreach( show( _ ))) //3
  clusters.map( _.stdDev(XTSeries[DblVector](obs, euclidean))).
foreach( show( _ )  )  //4
}

在上述代码中，首先使用聚类数量K和最大迭代次数MAX_ITERS初始化KMeans类（第1行），这两个参数是特定于领域和问题的。然后执行聚类算法（第2行），返回一个聚类列表。接着显示每个聚类的