
小项目
文章平均质量分 90
aa838260772
这个作者很懒,什么都没留下…
展开
-
搜索引擎项目
搜索引擎1. 程序开发环境Server端Linux: centos6.0 G++: version 4.4Client端Php2. 系统目录结构src :存放系统的源文件(.cpp) 。include:存放系统的头文件(.h) 。bin: 存放系统的可执行程序。conf:存放系统程序中所需的相关配置信息。lib: 存放系统程序中所使原创 2014-09-26 21:22:30 · 831 阅读 · 0 评论 -
搜索引擎源码及流程
对从网络上抓取到的网页进行处理:建立网络库,分词,去重,if-tdf计算权重,归一化,然后根据查询词将文本相似度从高到低的依次返回给客户第一阶段:python网络爬虫抓取网页,并存盘第二阶段:对磁盘上的网页文件建立网页库,将全部网页写入网页库,并建立相应网页的偏移量索引文件(1 23 100)-->(dofid, offset, size),以便读取网页内容原创 2014-10-04 13:11:39 · 1512 阅读 · 0 评论