
SE专题
文章平均质量分 64
hwalk
这个作者很懒,什么都没留下…
展开
-
自动分类在搜索引擎性能优化中的应用
自动分类:按照分类标准,将考察对象划分到各类别下自动聚类:按照被考察队形的内部特征,把相似、近似、特征相似的对象聚合到一起 信息查询方式: ――分类浏览:基于网站分类目录,浏览对象为网站――成本高,更新维护量大 ――关键词检索:检索对象为网页,信息量大,更新及时,不须人工干预――信息量大,质量难以保证 ====》提供对关键字检索结果集网页的分类浏原创 2004-12-31 16:17:00 · 2937 阅读 · 1 评论 -
搜索引擎中用户行为特征分析
搜索引擎维护的两类信息: 网页相关信息(通过信息获取部分获取);用户行为信息(通过log记录获取) 传统IR技术:(information retrieval) 文档的向量空间模型 Tf*idf算法 ―――利用web信息本身的特点和用户行为信息补充 ―――分析网页通过超连接形成的有向原创 2004-12-31 16:23:00 · 2738 阅读 · 0 评论