首先给出闵老师的课程链接:https://blog.youkuaiyun.com/minfanphd/category_11236630.html
14.2 课堂练习
- 写出本例中的 U\mathbf{U}U, C\mathbf{C}C, D\mathbf{D}D 和 V\mathbf{V}V. 注: 最后两个属性为决策属性.
- III是怎么表示的?
答:1.
U={xi}i=17\mathbf{U}=\{x_i\}_{i=1}^7U={xi}i=17
C={\mathbf{C}=\{C={Headache,Temperature,Lymphocyte,Leukocyte,Eosinophil}\}}
D={\mathbf{D}=\{D={Heartbeat,Flu}\}}
V={\mathbf{V}=\{V={Yes,No,High,Normal,Low,Abnormal}\}}
I:(用户U+属性C/决策D)→属性值VI:(用户\mathbf{U}+属性\mathbf{C}/决策\mathbf{D}) \to 属性值\mathbf{V}I:(用户U+属性C/决策D)→属性值V
14.5
定义一个标签分布系统, 即各标签的值不是 0/1, 而是 [0, 1]区间的实数, 且同一对象的标签和为 1.
答:A label distribution learning system is a tuple S=(X,Y)S = (\mathbf{X}, \mathbf{Y})S=(X,Y) where X=[xij]n×m∈Rn×m\mathbf{X} = [x_{ij}]_{n \times m} \in \mathbb{R}^{n \times m}X=[xij]n×m∈Rn×m is the data matrix, Y=[yik]n×l∈[0,1]n×l\mathbf{Y} = [y_{ik}]_{n \times l} \in [0, 1]^{n \times l}Y=[yik]n×l∈[0,1]n×l is the label matrix, nnn is the number of instances, mmm is the number of features, and lll is the number of labels, and satisfy ∑k=1lyik=1\sum\limits_{k=1}^l y_{ik} = 1k=1∑lyik=1.
15.3
找一篇你们小组的论文来详细分析数学表达式, 包括其涵义, 规范, 优点和缺点.
答:《COS-LDL: Label Distribution Learning by Cosine-Based Distance Mapping Correlation》
-
表达式:
-
含义: 根据cos距离的值来进行样本间是否有正负关联的判断。如果cos距离为负值,认为样本间是负相关;cos距离为正数时,认为样本间是有正关联的;当cos距离为0时,表示样本间没有关联性。
-
优点: 表达清晰,含义可理解性高
-
缺点: 暂无
- 表达式:
- 含义: 式5给出了欧式距离,式6将式4和式5做乘积运算,即将样本间的距离转化为了正距离,0,负距离,分别表示样本正相关,不相关,负相关。
- 优点: 表达清晰,含义可理解性高,同时将想法公式化了
- 缺点: 暂无