有限序列的统计性质与算法复杂度分析
1. 引言
在研究序列的统计性质时,无限序列和有限序列的情况有所不同。无限序列的统计性质可由Martin - Löf随机性理论简单推导得出,而有限序列的情况则更为复杂。本文主要探讨高Kolmogorov复杂度有限序列的子串出现频率、块统计以及游程长度等统计性质,同时分析算法复杂度函数 (C) 的相关算法性质。
2. 0和1的统计性质
2.1 随机性程度与Kolmogorov复杂度
在有限情况下,随机性是一个程度问题。我们可以用Kolmogorov复杂度来表示有限序列的不可压缩程度,进而分析其统计性质,例如序列中0和1的数量。
2.2 高复杂度序列的统计特性
几乎所有有限序列都具有接近最大的Kolmogorov复杂度,每个最大复杂度的序列都应具有整体集合的近似预期(平均)统计特性。例如,高复杂度的有限二进制序列是正态的,即对于相对较小的 (k),长度为 (k) 的每个二进制块出现的频率大致相等,特别是当 (k = 1) 时。
若 (x) 的长度为 (n),且 (C(x|n) = n + O(1)),则 (x) 中包含的零的数量为 (\frac{n}{2} + O(\sqrt{n}))。
2.3 相关定义与引理
- 符号定义 :(K(x|y)) 满足 (C(x|y) \leq K(x|y) \leq C(x|y) + 2 \log C(x|y) + 1),可大致看作长度为 (l(p) = C(x|y)) 的自定界程序 (p) 的长度。
超级会员免费看
订阅专栏 解锁全文
3104

被折叠的 条评论
为什么被折叠?



