
搜索引擎SE
文章平均质量分 76
ylf13
这个作者很懒,什么都没留下…
展开
-
搜索引擎学习资源收集
这篇文章貌似至少六年前人写的,很多信息可能有些过时了,例如博客链接都失效了,大家就取其精华把 [转自]http://wind-bell.iteye.com/blog/81504 搜索引擎学习资源收集 一、搜索引擎技术/动态资源 、综合类 1、卢亮的搜索引擎研究 http://www.wespoke.com/ 卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎转载 2013-11-19 17:37:24 · 2644 阅读 · 0 评论 -
搜索引擎入门(一)
郑重申明:本系列文章是学术性文章,请认真对待!如果你面带微笑看完,请重新认真阅读! 作者:ylfDSB-元 --------------------------------- from now on,开始小小研究下搜索引擎这个让我感到可怕的喜爱的领域,因为这里的算法可以说是现在最先进的,而且这里提供的服务是最一流 的,也是Google百度这些公司让我着迷膜拜。。。忽略我的无知。。。当然还有一原创 2013-11-08 15:26:50 · 1137 阅读 · 0 评论 -
正则表达式
推荐大家一个正则表达式速成网址:http://deerchao.net/tutorials/regex/regex.htm 版本:v2.33 (2013-1-10) 作者:deerchao 下面是我的学习笔记 在网页抓取中,我们经常需要分析html内容,而其内容庞大,节点多,如何高效识别呢?推荐大家使用正组表达式: (1)常用元字符 常用的元字符 代码 说明 . 匹配除换行符以原创 2013-11-23 21:38:23 · 1045 阅读 · 0 评论 -
搜索引擎入门(二)
申明:我也是刚开始学习搜索引擎,如果有不妥指出望指出,此系列博文只是记录我学习的历程罢了,不喜勿喷。 Author:元子 ********************************************************************* 搜索引擎一般可以分为四个系统: (1)下载系统 就是我们平时所说的爬虫,Crawler. 在Windows下,原创 2013-11-09 17:09:36 · 846 阅读 · 0 评论 -
搜索引擎入门(三)
申明:我也是刚开始学习搜索引擎,如果有不妥指出望指出,此系列博文只是记录我学习的历程罢了,不喜勿喷。 Author:元子 ********************************************************************* 继续上一章,说了这么多,今天就简单实现下程序中网页抓取的过程。 Crawler_v1 首先需要:apache原创 2013-11-11 19:42:39 · 941 阅读 · 0 评论