在阅读深度学习类论文的时候,经常会见到embedding这个名词,却一直不知道其具体含义是什么,遂查询了很多资料,终于明白了其作用,记录于此,希望能帮助对此同样疑惑 的人。
1、在讲embedding之前必须要先说一下独热编码(one-hot),如果你已经对其有一定了解,可以跳过这一段。
独热编码(one-hot)的作用很简单,就是把特征全都用0、1来表示,直接看个例子:
有四类人:老年人、中年人、青年、幼儿
将其用独热编码进行表示
老年人:1000
中年人:0100
青年:0010
幼儿:0001
可以看到每一类人都有一个一维数组(列表)与之对应,这个对应数组的特点就是只有一位是1,其余全是0。
经过one-hot,我们原有的一位数组(列表)
[‘老年人’,‘中年人’,‘青年’,‘幼儿’]
转化为了一个二维稀疏矩阵
[
[1000