1.有监督学习
features(attributes) ----> label(target) [ label(target)是为了告诉你对错]
机器学习要考虑他的准确性以及可解释性。
2.决策树算法(decision trees)
(1)Entropy(熵)
,(i=1,......n)
H表示熵。
熵越小,越稳定。
(2)Conditional Entropy(条件熵) # 类比于条件概率
Mutual informational(互信息、信息增量)
(3)Gain(S, A) = 熵 - 条件熵的和 ???
考量一个模型:性能(精度)+ 复杂度
实际应用中:可以利用决策树去选取特征,再考虑使用其他模型。