高维空间训练得到的分类器相当于低维空间的一个复杂非线性分类器,这类分类器容易产生过拟合。如果一直增加维度,原有的数据样本会越来越稀疏,要避免过拟合就需要不断增加样本。数据的稀疏性使得数据的分布在空间上是不同的,在高维空间中心比边缘区域具有更大的稀疏性(举例,正方体和内切圆到超立方体和超球面,随着维度趋于无穷,超球面体积趋向于0而超立方体体积永远是1)