SMOTE python实现

本文展示了如何利用Python中的sklearn.neighbors模块和random库实现SMOTE(合成少数类过采样技术)。首先创建样本数据X,然后通过NearestNeighbors找到每个样本的最近邻,接着随机选择邻居生成新的合成样本,以平衡类别分布。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

from sklearn.neighbors import NearestNeighbors
from random import choice

X = np.array([[-1, -1],
              [-2, -1],
              [-3, -2],
              [1, 1],
              [2, 1],
              [3, 2]])
neigh = NearestNeighbors(n_neighbors = 5)
neigh.fit(X)
N=3

S = np.zeros(shape=(X.shape[0]*(N-1), X.shape[1]))
S = np.vstack((X, S))
print S
for i in xrange(X.shape[0]):
    nn = neigh.kneighbors(X[i].reshape(1, -1), return_distance=False)
    for n in xrange(N-1):
        nn_index = choice(nn[0])
        #NOTE: nn includes T[i], we don't want to select it
        while nn_index == i:
            nn_index = choice(nn[0])
        dif = X[nn_index] - X[i]
        # print dif
        gap = np.random.random()
        index = n + i * (N-1)+X.shape[0]
        print index
        S[index, :] = X[i,:] + gap * dif[:]

print S
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值