降维案例instacart

# 1.获取数据
# 2.合并表
# 3.找到user_id和aisle之间的关系
# 4.pca降维
import pandas as pd
order_products=pd.read_csv('./data/instacart/order_products__prior.csv')
products=pd.read_csv('./data/instacart/products.csv')
aisles=pd.read_csv('./data/instacart/aisles.csv')
orders=pd.read_csv('./data/instacart/orders.csv')

#合并表
#合并aisles和products
tab1=pd.merge(aisles,products,on=['aisle_id'])
tab2=pd.merge(tab1,order_products,on=['product_id'])
tab3=pd.merge(tab2,orders,on=['order_id'])

# 找到user_id和aisle之间的关系
table=pd.crosstab(tab3['user_id'],tab3['aisle'])
data=table[:10000]

#降维
from sklearn.decomposition import PCA

pca=PCA(n_components=0.95)
data_new=pca.fit_transform(data)
data_new.shape#降维到42个特征了还保留了95%的信息

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值