数据挖掘中变量评估与CHAID方法的应用
1. 变量评估的通用关联测试
在变量评估中,通用关联测试是一种重要的方法,其具体步骤如下:
1. 绘制散点图与中线 :在散点图中绘制N个平滑点,并绘制一条水平中线,将这N个点分成大小相等的两组。
2. 连接点并计数 :从最左侧的平滑点开始连接N个平滑点,会得到N - 1条线段。统计穿过中线的线段数量m。
3. 显著性检验 :
- 原假设:所研究的两个变量之间没有关联。
- 备择假设:两个变量之间存在关联。
4. 计算检验统计量并判断 :检验统计量TS = N - 1 - m。
- 如果TS大于或等于表3.5中的临界分数,则拒绝原假设,结论是两个变量之间存在关联,平滑轨迹线表示关联的“形状”或结构。
- 如果TS小于表3.5中的临界分数,则不能拒绝原假设,结论是两个变量之间没有关联。
| N | 95% | 99% |
|---|---|---|
| 8 - 9 | 6 | — |
| 10 - 11 | 7 | 8 |
| 12 - 13 | 9 |
超级会员免费看
订阅专栏 解锁全文
44

被折叠的 条评论
为什么被折叠?



