机器学习中几何的新应用
1. 交叉验证与模型分析
在模型分析中,交叉验证是一个重要的环节。交叉验证后的模型与未交叉验证的模型结果会有所不同,这表明模型在不同折叠中存在一定的一致性,但并非完全重叠。例如,在某个研究中发现,天才儿童被安排在补救课程中时,患抑郁症的比例往往较高,而像样本中的这类儿童,若被安排在补救课程中且开始出现抑郁迹象,可能会从干预措施中受益。同时,欺凌也是导致抑郁的一个潜在问题,这提示我们在学校中不应容忍欺凌行为,以实现最佳的心理健康效果。
当样本量较小时,广义线性回归模型可能难以准确估计系数。基于拓扑和几何的线性模型所需的样本量似乎比线性回归更小,并且在小样本问题上的一致结果表明,这些模型可以处理非常小的数据集。不过,交叉验证可能仍需要一个最小样本量,因此如果样本量小于 10,最好避免进行此类分析。
2. 使用 dgLARS 预测信用违约
为了了解 dgLARS 在具有二元结果(逻辑回归)、更多观测值和变量的大型数据集上的工作原理,我们可以考虑使用 UCI 信用违约数据集。该数据集包含 2005 年末台湾的 30,000 个信用案例以及 23 个违约预测因子,包括人口统计学信息(年龄、婚姻状况、教育程度和性别)、信用额度以及先前的使用和还款信息。
以下是具体的操作步骤:
1. 加载数据 :
mydata<-read.csv("UCIDefaultData.csv")
- 加载库 :
超级会员免费看
订阅专栏 解锁全文
1999

被折叠的 条评论
为什么被折叠?



