# 商品行为计数,用于计算 top50 热门商品
item_statistc = features.groupby(['item_id'])[['user_id']].count() #单一索引/复合索引相关知识 我对这个reset_index函数的重要性认识还待提高 #http://selectgoodboy.blog.163.com/blog/static/1032120612015191117118/ item_statistc.reset_index(inplace=True) #变更列名 item_statistc.columns = ['item_id','itemCount']
#%% # 热门商品 top 50 item_Top50 = item_statistc.sort_values(by=['itemCount'],ascending=False).head(50)['item_id'].reset_index(drop=True) #%% item_Top50.head()