新闻网页排序与普通网页排序有几个显著的区别。首先是时效性,新闻网页一般都有发布时间,这是新闻的重要特征,所以排序时必须考虑到,另外就是新闻网页的链接较少,类似PageRank的链接分析在这里很难用上。
对新闻网页排序可能考虑的几个因素:时间(Time);发布新闻的网站(Source);该新闻的流行程度(Popularity),这主要可以通过聚类分法找到同类新闻的数量.当然肯定还有其他的因素可以考虑。
本文探讨了新闻网页排序与普通网页排序的区别,并介绍了几个关键排序因素:时间、新闻发布源及新闻流行程度。对于新闻网页,排序算法需要考虑发布时间、来源权威性及同类新闻数量等特性。
新闻网页排序与普通网页排序有几个显著的区别。首先是时效性,新闻网页一般都有发布时间,这是新闻的重要特征,所以排序时必须考虑到,另外就是新闻网页的链接较少,类似PageRank的链接分析在这里很难用上。
对新闻网页排序可能考虑的几个因素:时间(Time);发布新闻的网站(Source);该新闻的流行程度(Popularity),这主要可以通过聚类分法找到同类新闻的数量.当然肯定还有其他的因素可以考虑。

被折叠的 条评论
为什么被折叠?