统计表格与自然语言处理研究进展
1. 小型统计表格及其在自然语言处理中的应用
小型统计表格虽不能替代专业统计书籍或计算机软件,但能提供统计自然语言处理(Statistical NLP)应用中常用的关键值。以下是几种重要的统计分布表格及其应用说明。
1.1 标准正态分布
标准正态分布表格给出了从负无穷到特定 (z) 值的标准正态曲线下的面积比例。通过该表格,我们可以快速查询不同 (z) 值对应的比例,用于概率计算和统计推断。例如,在进行数据标准化处理后,可利用此表格判断数据点在总体中的相对位置。以下是部分 (z) 值对应的比例:
| (z) | 比例 |
| ---- | ---- |
| -3 | 0.0013 |
| -2 | 0.023 |
| -1 | 0.159 |
| 0 | 0.5 |
| 1 | 0.841 |
| 2 | 0.977 |
| 3 | 0.9987 |
1.2 (学生)(t) 检验临界值
(t) 分布的临界值表格用于在不同自由度(d.f.)下,确定双侧和单侧检验的临界值。双侧检验中,曲线下介于 (-t^ ) 和 (t^ ) 之间的面积为 (C);单侧检验中,曲线下介于 (t^*) 和正无穷之间的面积为 (p)。当自由度为无穷大时,(t) 检验的临界值与 (z) 检验相同。以下是部分自由度和概率对应的临界值:
| (p) | 0.05 | 0.025 | 0.01 | 0.005 | 0.001 | 0.0005 |
| ---- | ---- | ---- | ---- |
超级会员免费看
订阅专栏 解锁全文
5530

被折叠的 条评论
为什么被折叠?



