MDS 降维

最新推荐文章于 2023-01-12 23:30:18 发布

原创最新推荐文章于 2023-01-12 23:30:18 发布 · 837 阅读

2 ·

CC 4.0 BY-SA版权

数据挖掘专栏收录该内容

5 篇文章

订阅专栏

MDS 降维：点击打开链接

import numpy as np

import tensorflow as tf
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

data = []

cty_data = []
def data_p(fliename):
    fr = open(fliename)

    tid = 0
    cid = 0
    for line in fr.readlines():     
        tline = line.strip().split(';')

        data.append(tline)
        
        cn = tline[0]
        if tid==0:
            cty_data.append([tid])
            #print(cty_data)
            #print(cty_data[cid][0])
        elif cn == data[cty_data[cid][0]][0]:
            cty_data[cid].append(tid)
        else:
            cid += 1
            cty_data.append([tid])

        tid += 1
            

data_p('C:\\Users\\imac\\Desktop\\2018\\bigdata\\py\\wealth1951.txt')
cty_data = np.asarray(cty_data)
#print(cty_data)
data = np.asarray(data)
#print(data[cty_data[:,:],0])

cdata = []

def getdata():
    for i in range(len(cty_data)):
        itm =  data[cty_data[i,-1],3:6]

        cdata.append(itm)

   
getdata()
cdata = np.asarray(cdata,dtype=np.float32)

def dis(v1,v2):
    return np.sqrt(sum(np.power(v1-v2,2)))

lenn = len(cdata)
DD = np.zeros([lenn,lenn])

for i in range(lenn):
    for j in range(i,lenn):
        dist = dis(cdata[i],cdata[j])
        DD[i,j] = dist
        DD[j,i] = dist

#print(DD)

D=np.array([[0,411,213,219,296,397],
            [411,0,204,203,120,152],
            [213,204,0,73,136,245],
            [219,203,73,0,90,191],
            [296,120,136,90,0,109],
            [ 397,152,245,191,109,0]])

def MDS(D,k):
    N = D.shape[0]
    T = np.zeros([N,N])

    D2 = D**2
    H = np.eye(N) - 1/N
    T = -0.5 * np.dot(np.dot(H, D2), H)

    eigVal, eigVec = np.linalg.eig(T)
    indices = np.argsort(eigVal)# 返回从小到大的索引值

    indices = indices[::-1] # 反转
    eigVal = eigVal[indices]
    eigVec = eigVec[:,indices]

    m = eigVec[:,:k]
    n = np.diag(np.sqrt(eigVal[:k]))
    X = np.dot(m,n)

    print(eigVal.shape)
    print(m.shape)

    print(n.shape)
    print('original distance','\tnew distance')
    for i in range(N):
        for j in range(i+1,N):
            print(np.str(D[i,j]),'\t\t',np.str("%.4f"%np.linalg.norm(X[i]-X[j])))
    
    return X

X = MDS(DD,2)

fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')  
ax.scatter(X[:, 0], X[:, 1]) 

plt.show()