自动柯尔莫哥洛夫复杂度与正态性的再探讨
1. 自动描述模式相关内容
- 对于新自动机,其开销是每使用 N 个输入符号来描述 x 就有一个符号的开销,由于 N 可以任意大,能得到所需的界限。并且新自动机是 O(1) 值的,可能的切换位置由辅助位模 N + 1 的位置决定,这使得对应给定输入的可能输出数量只有一个有界因子(N + 1)。
- 组合 S ◦ R 是一种自动描述模式。此外,将给定描述模式 R 与提供输入块编码的模式进行组合,块编码可由自动机实现,当 |B| 不是 2 的幂时会有一些开销,但使用大的块大小的块编码时,相应因子会任意接近 1。
2. 正常序列和数的定义
考虑无限位序列 α = a0a1a2 … 和整数 k ≥ 1,将序列 α 拆分为 k 位块:α = A0A1 … 。对于每个 k 位字符串 r,考虑其在 Ai 中的极限频率,即当 N → ∞ 时 #{i: i < N 且 Ai = r}/N 的极限。这个极限可能存在也可能不存在,如果对于某个 k 和所有 r 都存在,则得到 k 位字符串上的概率分布。
- 定义 :如果对于每个数 k 和每个长度为 k 的字符串 r,这个极限都存在且等于 2−k,则序列 α 是正常的。有时具有这些性质的序列被称为强正常序列,而“正常”这个名称保留给 k = 1 时具有此性质的序列。
- 非对齐正常序列 :考虑序列中某个字符串 r 的所有出现情况,而不仅仅是起始点是 k 的倍数的对齐情况。要求对于所有 k 和所有长度为 k 的字符串 r,#{i < N : αiαi+1 … αi
超级会员免费看
订阅专栏 解锁全文
69

被折叠的 条评论
为什么被折叠?



