
爬虫
爬虫记录
不要踩井盖儿
这个作者很懒,什么都没留下…
展开
-
爬虫(二):Lucene
搜索引擎:* 什么是搜索引擎* 搜索引擎基本运行原理* 原始数据库做搜索有什么弊端* 倒排索引(敲黑板)lucenelucene相关的概念lucene和solr的关系lucene入门程序(写入索引的操作代码)lucene相关写入索引的api的解释ik分词器lucene的搜索: 基础的搜索(2个), 多样化的搜索(5个)lucene的高级(理解)lucene的高亮...翻译 2018-10-31 17:46:45 · 843 阅读 · 0 评论 -
爬虫(三):Solr
lucene的索引的修改和删除solr: 1) solr的概念2) solr的部署(2种方式)3) solr的管理界面4) solr的配置文件: solrConfig.xml schema.xml core.properties5) solrj 连接solr 相关的操作: C U R D6) solr的高级: 高亮 分页 排序 1. lucene的索引的修改和删除索...翻译 2018-10-31 17:49:34 · 632 阅读 · 0 评论 -
爬虫(一):基本内容回顾
本人最近在学习爬虫的相关知识,对于很多基本的概念在此做一个梳理,便于课程的复习和巩固,如有写的不准确或错误的地方,欢迎阅读者批评指正.要聊爬虫主要是从以下几个方面为主线:什么是爬虫?爬虫的价值爬虫的分类爬虫的基本运行原理爬虫的三大模块爬虫协议1.什么是爬虫?想到爬虫,很多人的第一印象就是现实世界中到处爬着找食物的虫子,其实在计算机的世界里亦是如此:所谓的爬虫就是程序员...原创 2018-08-26 14:56:48 · 665 阅读 · 0 评论