28、深入探索核密度估计及其应用

核密度估计原理与应用

深入探索核密度估计及其应用

1. 高斯混合模型生成新数据

在数据建模中,我们有时需要根据已有的数据分布生成新的数据样本。这里我们使用高斯混合模型(GMM)来实现这一目的。

1.1 选择合适的模型组件数量

经过分析,大约 110 个组件能使 AIC(赤池信息准则)最小化,我们将使用这个模型。以下是拟合数据并确认模型收敛的代码:

gmm = GMM(110, covariance_type='full', random_state=0) 
gmm.fit(data) 
print(gmm.converged_) 

运行上述代码后,如果输出为 True ,则表明模型已经收敛。

1.2 生成新的数据样本

接下来,我们可以使用这个 GMM 作为生成模型,在 41 维投影空间中绘制 100 个新的数据点:

data_new = gmm.sample(100, random_state=0) 
data_new.shape 

运行上述代码后,输出结果为 (100, 41) ,这表明我们成功生成了 100 个 41 维的数据点。

1.3 构造新的手写数字

最后,我们可以使用 PCA 对象的逆变换来构造新的手写数字:

digits_new = pca.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值