目录
《西瓜书》和《统计学习方法》两本书的对应内容
第二章 模型评估与选择
评估方法
- 留出法(常规方法,用2/3~4/5的样本作为训练集)
- 交叉验证(k-fold,均分k份,每次用1份当测试,跑k次)
- 自助法 对于m个样本的数据集D,有放回地取出m个数作为训练集D’,会有1/e=0.368的数据没被取到,可以作为测试集,测试结果叫 “包外估计”
性能度量
-
查准率、查全率和F1
-
查准率
P = T P T P + F P P = \frac{TP}{TP+FP} P=TP+FPTP -
查全率
R = T P T P + F N R = \frac{TP}{TP+FN} R=TP+FNTP
这俩是矛盾的
- F1
F 1 = 2 × P × R P + R =
-