聚类的出现不太出名,但同样是重要的内容。正如它的名字意味着聚类技术试图把大量的事情聚集起来形成群集以便来分享它们的相似点。这是一种在大型的或者很难理解的数据集合中发现层次结构和规则的方法,用这种方法可以揭示有趣的模式或形成易于理解的数据集合。
谷歌新闻中心为了使介绍的新闻需要按逻辑模式来分类,而不是按一个包含所有文章的未加工的列表。因此他们运用聚类技术,根据文章主题来分组各类新闻。图1.3将会在下面举例说明。
像clusty group这样的搜索引擎搜索类似的原因。
客户可能被这种技术聚类,有可能是根据如:收入状况,地点,购买习惯等属性分成几个片段。
[img]http://dl.iteye.com/upload/attachment/424973/9da1e256-063d-3598-80c8-209ee0c628ac.png[/img]
图1.3一个来自于谷歌新闻中心的新闻分类样本。
这是一个来自于一篇典型故事的详细片段展示,并根据有此主题的群里的其他一些相似的故事联系起来。这也是很方便的,将其它所有的故事联系按照这样一个主题聚集在一起。
谷歌新闻中心为了使介绍的新闻需要按逻辑模式来分类,而不是按一个包含所有文章的未加工的列表。因此他们运用聚类技术,根据文章主题来分组各类新闻。图1.3将会在下面举例说明。
像clusty group这样的搜索引擎搜索类似的原因。
客户可能被这种技术聚类,有可能是根据如:收入状况,地点,购买习惯等属性分成几个片段。
[img]http://dl.iteye.com/upload/attachment/424973/9da1e256-063d-3598-80c8-209ee0c628ac.png[/img]
图1.3一个来自于谷歌新闻中心的新闻分类样本。
这是一个来自于一篇典型故事的详细片段展示,并根据有此主题的群里的其他一些相似的故事联系起来。这也是很方便的,将其它所有的故事联系按照这样一个主题聚集在一起。
本文介绍了聚类技术在处理大量难以理解的数据集时的重要性及其应用场景。通过聚类技术,可以发现数据间的层次结构和规律,揭示有趣模式并形成易于理解的数据集合。例如,谷歌新闻中心使用聚类技术对新闻进行分类,搜索引擎Clustygroup也采用类似的技术来组织搜索结果。此外,客户群体也可通过聚类技术进行细分。
789

被折叠的 条评论
为什么被折叠?



