Zipf分布
Zipf定律可以表述为在自然语言的语料库里,一个单词的出现次数与它在频率表里的排名成反比。Zip定律也叫二八定律,可以反映很多现象,比如互联网中的内容访问有20%的内容占有80%的访问量,20%的社会人士掌握有80%的财富,等等。Zipf定律是由美国语言学家Zipf发现的,他在1932年研究英文单词出现的频率时,发现如果把单词频率从高到低的次序排列,每个单词出现频率和它的访问排名存在简单反比关系,通过公式表述如下:
C
Zipf定律可以表述为在自然语言的语料库里,一个单词的出现次数与它在频率表里的排名成反比。Zip定律也叫二八定律,可以反映很多现象,比如互联网中的内容访问有20%的内容占有80%的访问量,20%的社会人士掌握有80%的财富,等等。Zipf定律是由美国语言学家Zipf发现的,他在1932年研究英文单词出现的频率时,发现如果把单词频率从高到低的次序排列,每个单词出现频率和它的访问排名存在简单反比关系,通过公式表述如下: