数据挖掘的可行性分析与计算机科学根源
1. 不同计算复杂度算法的运算次数
不同计算复杂度的算法在处理不同规模数据集时,所需的运算次数差异巨大。以下是不同数据集规模下,几种常见复杂度算法的运算次数:
| 数据集规模 | $n^{1/2}$ | $n$ | $n log(n)$ | $n^{3/2}$ | $n^2$ |
| — | — | — | — | — | — |
| Tiny | 10 | $10^2$ | $2 × 10^2$ | $10^3$ | $10^4$ |
| Small | $10^2$ | $10^4$ | $4 × 10^4$ | $10^6$ | $10^8$ |
| Medium | $10^3$ | $10^6$ | $6 × 10^6$ | $10^9$ | $10^{12}$ |
| Large | $10^4$ | $10^8$ | $8 × 10^8$ | $10^{12}$ | $10^{16}$ |
| Huge | $10^5$ | $10^{10}$ | $10^{11}$ | $10^{15}$ | $10^{20}$ |
| Massive | $10^6$ | $10^{12}$ | $1.2 × 10^{13}$ | $10^{18}$ | $10^{24}$ |
| Supermassive | $10^{7.5}$ | $10^{15}$ | $1.5 × 10^{16}$ | $10^{22.5}$ | $10^{30}$ |
从这个表格可以看出,随着数据集规模的增大,复杂度为 $n^2$ 的算法运算次数增长极为迅速,而复杂度为 $n^{1/2}$ 的
超级会员免费看
订阅专栏 解锁全文
266

被折叠的 条评论
为什么被折叠?



