一、背景
二、基本思想
1、数量假设:在Web图模型中,如果一个页面节点接收到的其他网页指向的入链数量越多,那么这个页面越重要。
2、质量假设:指向页面A的入链质量不同,质量高的页面会通过链接向其他页面传递更多的权重。所以越是质量高的页面指向页面A,则页面A越重要。
三、与爬虫的联系
确定一个待抓取网页的优先级,优先抓谁,优先显示谁。
四、简单推导
公式2中的2和1分别表示网页B和C的出
1、数量假设:在Web图模型中,如果一个页面节点接收到的其他网页指向的入链数量越多,那么这个页面越重要。
2、质量假设:指向页面A的入链质量不同,质量高的页面会通过链接向其他页面传递更多的权重。所以越是质量高的页面指向页面A,则页面A越重要。
确定一个待抓取网页的优先级,优先抓谁,优先显示谁。
公式2中的2和1分别表示网页B和C的出