1,第一个阶段是雅虎早期的方式——人工目录。完全通过人工来标记网页,这在互联网不太发达的时候还行得通。优点是精确,缺点是无法处理海量内容。
2,第二个阶段是后来google的方式,机器算法分词建索引排序。优点是可以处理海量的网页,缺点是对自然语言理解有一个极限,导致精确性不会太高,最终会达到瓶颈。
3,第三个社会化搜索,由网络上的用户做标记。用户虽然不如专家标注的精确,但是要好于机器算法。缺点是如何提高用户的参与度?让用户乐于标注。培养用户习惯是一个难题,但是这也有可能是一片蓝海,只要方向对,将能获得成功。毕竟现在的自然语言理解能力很有限,google的方式已经逐渐赶不上用户的要求了。