K均值聚类算法及其应用

#读取“农村居民人均可支配收入来源2016.xlsx”数据表,数据来源于2016年《中国统计年鉴》,

# 首先,对指标数据作均值-方差标准化处理,注意首列为地区名称,不用标准化

# 其次,对标准化后的指标数据,作K-均值聚类分析(K=4),

# 最后,给出聚类分析结果,用一个序列Fs来表示,其中index为地区名称,值为所属类别的标签值(0、1、2、3)。

def return_values():

    import numpy as np

    import pandas as pd

    from sklearn.preprocessing import StandardScaler

    from sklearn.cluster import KMeans

    data=pd.read_excel('农村居民人均可支配收入来源2016.xlsx')

    x=data.iloc[:,1:]

    scaler=StandardScaler()

    scaler.fit(x)

    x=scaler.transform(x)

    model=KMeans(n_clusters=4)

    model.fit(x)

    c=model.labels_

    Fs=pd.Series(c,index=data['地区'])

    Fs=Fs.sort_values(ascending=True)




 

    return Fs

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值