- 博客(13)
- 收藏
- 关注
原创 MapReduce 分析nginx日志例子
package com.sekorm.dataAnalysis.Main; import java.io.IOException; import java.util.List; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.ap
2017-12-14 21:41:40
708
原创 IKAnalyzer2012ff_hf1 源码修改单例模式Dictionary
由于原ik Analyzer 中 org.wltea.analyzer.dic Dictionary 是单例模式 程序无法动态加载行业词库,并里面起效。 故此类添加一个方法: public static void clear(){ singleton=null; } *****************************************************
2017-12-06 14:49:31
543
转载 基于Lucene7 IKAnalyzer 报错问题
新增2个类 ******************************************************************************************************************************************************************** import java.io.Reader;
2017-12-06 11:07:50
1336
原创 lucene Explanation 打分公式 boost 显示问题
Explanation查出的boost是查询时设置的boost,不是索引时设置的boost值 另外你查询的时候是多域搜索还是单域搜索。 例如: keyword: 深圳龙岗 分2个词,都在title 里面找, 则不会出现boost keyword: 深圳 只有一个词, 则会出现boost --------------------------------------------
2017-12-04 11:21:11
242
转载 jvm 设置
-Xms:最初分配的堆内存 -Xmx:最多分配的堆内存 超出了xms 的大小,JVM会向系统继续要内存,如果一直扩展到Xmx都不够的话,就抛出OOM了 -XX:PermSize:是默认永生代大小,永生代主要用来加载类和常量池,这部分很难GC.JDK8的Hotspot已经取消了永生代,改为元空间,元空间不需要制定大小,会自动扩展。 -XX:MaxPermSize:是永生代大小的上限。 -X
2016-09-22 10:59:48
270
原创 Elasticsearch 的windows安装 (版本:Elasticsearch 2.3.4)
https://www.elastic.co/downloads 下载 Elasticsearch windows 版本的 2.3.4 ZIP 版本 https://www.elastic.co/downloads 下载 Kibana windows版本 4.5.3 1.E:\elasticsearch-2.3.4\bin bin/plugin
2016-08-03 16:35:34
829
原创 seo 禁止百度快照
禁止百度保存快照的方法 在需要禁止百度缓存的网页到之间加上同样,如果需要禁止所有的搜索引擎缓存,那就是在需要禁止缓存的网页到之间加上 顺便提供一些常用meya属性 noarchive 限制了所有的搜索引擎建立网页快照。另外还有几个写法对做搜索引擎优化服务很有帮助 index 是允许搜索引擎抓取这个页面。 noindex是不允许抓取这个页面。 follow是可以从这个页面
2016-07-26 11:21:01
404
原创 seo 移动搜索 移动页面、转码页面、PC页面
禁止百度移动搜索对网页进行转码的方法 第一种,HTTP Response中显式声明Cache-control为no-transform。 第二种,meta标签中显式声明Cache-control为no-tranform,格式为:
2016-07-26 10:49:35
363
原创 Analyzer 中文分词器
IKAnalyzer: jar: IKAnalyzer-IKAnalyzer2012FF_u1.jarimport java.io.IOException; import java.io.StringReader; import java.util.ArrayList; import java.util.List; import org.apache.lucene.analysi
2016-07-20 16:21:59
575
转载 Apache Commons 工具类介绍及简单使用
Apache Commons包含了很多开源的工具,用于解决平时编程经常会遇到的问题,减少重复劳动。下面是我这几年做开发过程中自己用过的工具类做简单介绍。 组件 功能介绍 BeanUtils 提供了对于JavaBean进行各种操作,克隆对象,属性等等. Betwixt XML与Java对象之间相互转换. Codec
2016-06-02 16:23:41
744
原创 Spring 一些注解使用方法
Controller: @ResponseBody 返回的String 直接返回到前台,否则的话,就是找对应的页面
2016-05-19 17:31:11
246
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人