- 博客(4)
- 收藏
- 关注
原创 交叉熵
参考来源:https://blog.youkuaiyun.com/rtygbwwwerr/article/details/50778098 https://blog.youkuaiyun.com/jasonzzj/article/details/52017438 p(x定义)=Pr(X=x),x∈X
2018-07-05 17:11:08
1920
原创 hadoop 配合 grep
hadoop fs -cat /path/* | grep '|I tv' > tmphadoop fs -cat /path/20180701/00/* | grep '|I tv' >> tmphadoop fs -cat /path/2018070[1-9]/00/* | grep '|I tv' >> tmp
2018-07-02 15:49:40
2682
原创 创建并评估新特征
step1 创建新特征step2 离线评估新特征特征对正、负样本的覆盖率特征与样本label的互信息 互信息:两个变量的依赖程度,如果两个变量互相独立,则互信息为零。单特征信息增益 单特征信息增益:该特征加入前后,时间不确定性的减少量。增益越大,该特征对模型越重要。libfm评估新特征落入前后的auc...
2018-07-02 15:48:04
277
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人