- 博客(5)
- 收藏
- 关注
原创 MMD公式理解
第三个等式利用积分的性质,将积分移入内积,这依赖RKHS内积的连续性。sup下面的条件表示,映射函数f属于再生希尔伯特空间,并且它的范数不大于1,这一点是必要的,后面会看到。第一个等式是将期望表示成测度论形式(p(dx)是分布p对应的测度),第二个等式是利用RKHS的再生性。对于公式中的均值,可以经过下面的变换。现在已经很简洁了,但是因为μ无法直接得到,所以只能用均值替代计算,X为p分布,Y为q分布。利用内积的性质<a,b>≤||a|| ||b||,我们可以得到下面的公式。
2025-06-23 15:42:29
294
原创 数据异常值剔除
自定义规则:剔除 SOH 小于 0 或 大于 1 的数据点。# 计算 Z-score,剔除异常值。一、基于 Z-score 的异常值剔除。# 绘图(使用清理后的数据)# 计算 IQR,剔除异常值。# 绘图(使用清理后的数据)# 绘图(使用清理后的数据)二、基于 IQR 的异常值剔除。
2024-11-19 10:05:32
960
原创 特征提取的一种方法—对称不确定性
(Symmetrical Uncertainty, SU),是用于衡量两个变量之间关联度的一个常用指标。它在特征选择算法中很常见,用来确定哪些变量包含有意义的信息。的一个归一化指标,确保其取值范围在 [0,1][0, 1][0,1] 之间。
2024-10-29 09:07:18
771
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1