数据分析中的多种回归模型应用
1. 判别函数分析初步示例
首先,我们来看一个简单的矩阵数据示例。打印矩阵 tab
的值:
> tab
结果如下:
1 2 3
1 6 1 0
2 1 4 1
3 1 0 5
计算矩阵对角元素之和与矩阵所有元素之和的比值:
> sum(tab[row(tab) == col(tab)]) / sum(tab)
结果为:
[1] 0.7894737
在这个数据集中,留一法验证的准确率较低(仅 79%),这反映出再代入误差总是高估判别函数分析(DFA)的性能。这种差异在小数据集(如本示例)中尤为常见,而判别函数分析在大数据集中往往更为成功。
2. 多项逻辑回归:理解学生的项目选择
2.1 数据收集
假设高中生要选择项目,有普通项目、职业项目和学术项目三种选择,学生的选择基于写作成绩和社会经济地位。我们使用名为 hsbdemo
的学生数据集,该数据集可从以下链接获取: http://voia.yolasi