数据预处理清洗:
- 所有appid,都转化成类别
- 统计出低频的手机型号过滤掉用unk代替
特征提取:
- 手机品牌+型号 3259个手机型号
- app使用类别使用做为特征(45大类,288细类)
- 手机使用时间段偏好(每四小时分段)
- app类别 使用时长 top 5 (替换掉特征2)
- 手机使用总时长
网络结构,256->128->64->num_classes
train size: 45000 test size:5000
不用brand2id, 2.7775
使用全量brand2id, 2.7656 (basic_brand_freq_threshold=0)
使用全部映射的brand2id 2.7717
使用全量brand2id, 2.7691 (basic_brand_freq_threshold=10)
使用全量brand2id+系统应用 2.7669
model-deep-044-2.7554.hdf5