Google Wide And Deep model 解释与应用

Wide&Deep模型由Google于2016年提出,应用于分类和回归任务,它结合了线性模型的记忆能力和深度神经网络的泛化能力。模型分为两部分:Wide端负责离散特征的交叉组合以实现记忆,Deep端通过特征嵌入实现泛化。

    这个模型是Google2016年6月发布用于分类和回归的模型,首次应用在了Google Play的推荐上,它的核心思想是结合线性模型的记忆能力(memorization)和DNN模型的泛化能力(generalization),在训练时同时优化2个模型的参数,从而达到整体模型的预测能力最优,这个有别于组合模型(组合模型是在分别训练几个模型,在预测层再组合)

注:为什么线性模型有记忆能力,而DNN模型有泛化能力?文章指出,wide端模型通过离散特征的交叉组合进行memorization, deep端模型通过特征的embedding进行generalization. 同时wide and deep模型中使用的特征包括两大类:一类是连续型特征,主要用于deep模型的训练,包括real value 类型的特征及embedding类型的特征等;一类是离散型特征,主要用于wide模型的训练,包括sparse类型的特征以及cross类型的特征等。


几个数据编码的方法讲解一下:

(1)sparse column from keys

  (2)  sparse column from vocabulary file

  (3)  sparse column with hash bucket

  (4)  crossed column (笛卡尔积)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值