股票市场异常检测与MOOC课程创建策略
股票市场异常检测
在股票市场数据集中,为了检测异常情况,采用了一种结合K-means聚类算法和自定义得分(dev-score)的方法。
数据与聚类结果
使用了5990个股票市场数据点进行分析。通过运行K-means算法,形成了两个聚类,分别标记为0和1。以下是这两个聚类的质心位置和波动情况:
| 聚类 | 质心位置(Volume) | 波动(Fluctuation) |
| ---- | ---- | ---- |
| 0 | 455,940.01 | 1.36 |
| 1 | 10,746,971.05 | 2.35 |
聚类结果中,蓝色和黄色点分别代表属于两个不同聚类的数据点,星号表示它们的质心。距离质心最远的聚类被检测为异常值。
异常检测步骤
- 计算dev-score :在聚类出现后,为两个聚类中的所有点计算dev-score。
- 标记异常点 :如果某个点的dev-score大于为每个聚类设置的阈值,则该点被标记为异常。
经过对5990个数据点的处理,发现聚类0中有5866个点(蓝色点),聚类1中有114个点(黄色点)。计算每个点的dev-score后,聚类0中有97个异常值,聚类1中有2个异常值。
在具体的输出截图中,对于不同股票标记为“0”和“1”的两个聚类,还可以观察到每个公司的dev-score值。例如,“ABX”和“FIT”公司的dev-score值大于2.
超级会员免费看
订阅专栏 解锁全文
765

被折叠的 条评论
为什么被折叠?



