18、点过程行为聚类与决策树预测确定性估计

最新推荐文章于 2025-12-03 10:30:50 发布

time3

最新推荐文章于 2025-12-03 10:30:50 发布

阅读量16

点赞数

CC 4.0 BY-SA版权

分类专栏：智能数据分析前沿探秘文章标签：点过程行为聚类决策树预测确定性估计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/time3/article/details/153682033

智能数据分析前沿探秘专栏收录该内容

56 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

点过程行为聚类与决策树预测确定性估计

1. 点过程行为聚类

1.1 聚类区分标准

在对尖峰序列进行聚类时，两种算法可能会以任意顺序报告找到的聚类，因此需要一个标准来区分它们。具体做法如下：
1. 对于找到的每个聚类 (C)，计算其平均轮廓曲线 (m_C(x))：
- 公式为 (m_C(x)=\frac{1}{|C|}\sum_{T\in C}s_T^{\prime\prime}(x))，其中 (|C|) 是聚类 (C) 中的尖峰序列数量，(s_T^{\prime\prime}(x)) 是尖峰序列 (T) 的二阶导数曲线。
2. 计算每个 (m_C) 的曲线下面积（AUC）。
3. 选择 AUC 最小的聚类，该聚类与许多尖峰序列贡献的时间帧重叠最小，可认为是噪声行为的原型。其余尖峰序列则标记为潜在的组件候选者，可使用其他方法进一步处理。

由于只需要区分哪些尖峰序列是噪声，哪些是组件候选者，因此可以将层次聚类限制为恰好报告两个聚类，一个是噪声，另一个包含组件尖峰序列。

1.2 评估方法

为了评估上述方法，生成了多个人工尖峰序列集，并运行算法来报告组件和非组件尖峰序列。由于这是一种分类问题，可以使用分类质量度量，如调整兰德指数（ARI）和调整互信息（AMI）来评估该方法。这两种度量基于预测的聚类标签计算两个不同聚类结果之间的一致性，且与聚类标签的顺序无关。ARI 基于绝对一致数量，AMI 基于两个聚类共享的互信息。

生成人工尖峰序列的步骤如下：
1. 从指数分布中采样尖峰间隔（两个连续事件之间的时间），直到达到指定的尖峰序列长度，即生成泊松点过程。
2. 非组

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。