- 博客(3)
- 收藏
- 关注
Nutch index源代码解析二)
接着上篇文档~~~~~上篇文章写到,Nutch采用一个MR对爬取下来的文档进行清洗和封装成一个action列表。接下来介绍怎么爬取下来的数据如何推送给solr。----------------------------------------------------华丽的分割线---------------------------------------------Ntuch自定义...
2013-03-15 10:56:54
129
Nutch index源代码解析(一)
Nutch集成slor的索引方法介绍/** * 建立索引 * @param solrUrl solr的web地址 * @param crawlDb 爬取DB的存放路径:\crawl\crawldb * @param linkDb 爬取link的存放路径:\crawl\linkdb * @param segments 元数据存放路径:\crawl\se...
2013-03-14 10:41:34
135
原创 递归算法
public class Test { static int multiply(int n) { if (n == 1 || n == 0) { return n; } else { return n * multiply(n - 1); } } public static void main(String[] args) { System....
2010-09-13 14:19:42
114
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人