如何使用Embedding?
最近需要用到Embedding做特征嵌入,但是网上找不到embedding的具体用法,东拼西凑终于看懂了,写篇文章总结一下,顺便整理一下来龙去脉。
Embedding可以说是一种对离散特征进行编码的手段、
而说到离散特征编码,相信大部分人第一是将会想到Onehot编码,举例回顾一下Onehot编码。
1. 什么是OneHot编码
mnist数据集相信大家都已经耳熟能详,是一个用于手写数字分类的数据集,共有0-9十个数字,所以其label必然也会有10种:0-9,对应数字0-9。
那么如果使用OneHot编码,那么:
0: [1, 0, 0, 0, 0, 0, 0, 0, 0, 0]
1: [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]
2: [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
3: [0, 0, 0, 1, 0, 0, 0, 0, 0, 0]
4: [0, 0, 0, 0, 1, 0, 0, 0, 0, 0]
5: [

本文对比了OneHot编码与Embedding技术在处理离散特征时的不同之处,阐述了Embedding如何有效减少特征维度,提供了TensorFlow 1.x中使用Embedding的实际案例。
最低0.47元/天 解锁文章
1720

被折叠的 条评论
为什么被折叠?



