- 博客(9)
- 收藏
- 关注
转载 Spring入门基础 @RequestParam必须要加上参数名
今天一个大意的疏忽导致公司中断服务俩个小时。只能说学spring太囫囵吞枣。横跨了俩个版本后的spring,充分给了你自由,于是就想当然的被不起眼的bug打败。现在回想起来。看网上资料学spring时,都在说 1.直接写@RequestParam就行了,会把请求中同名参数绑定到方法上。...
2013-10-30 21:55:00
278
转载 在非Spring组件中获取SpringBean
最近项目开始用spring。最恼火的地方是在spring外部实例化的bean需要获得ioc的功能。 发现有俩种模式。 1.BeanFactoryAware接口方式。需要myclass extends BaseAutoAware。 用于第三方组件通过反射newInstance...
2013-10-23 18:48:00
241
转载 网页正文提取的思路
尝试一下: title: 100 H1 H2 字号标题:70 文章第一段: 60 正文:10 正文带link:30 在不断追踪网页文本提取的技术,这篇文章中提到的做法很有实用价值! 网页由于格式千变万化,要找到一种能提取任意网页正文的 算法...
2013-03-13 14:33:00
283
转载 simhash与Google的网页去重(转)
网上疯传巨NB的simhash算法,谁也不知道这个是怎么推导出来,有什么凭据可以以一维的字符串指示俩篇文章的相似程度。怀着对google无比崇拜,在最近的项目中使用过后,却感觉效果很不理想。 项目中选用的是32位,2汉明距离去重。吭哧俩天把这个功能加入后发...
2013-03-11 14:00:00
215
转载 lucene-利用内存中索引和多线程提高索引效率
lucene-利用内存中索引和多线程提高索引效率 1、RAMDirectory和FSDirectory对比 RAMDirectory在内存中所进行的操作比FSDirectory在磁盘上所完成的工作要快得多。 2、即使使用索引参数来使Lucene减少在磁盘上合并段的...
2013-03-05 10:36:00
131
转载 跨JVM同步问题
想起前阵被坑简历的经过。问道一个多JVM下如何同步的问题。 关于这个问题,我之前并没有想到多official的解决方法,于是告诉他,我们是如何做的。 如果是单机多JVM就放了文件lock.lock。每个jvm试着先获取文件锁。如果是多机上的jvm,就在memcached上放了个对...
2012-11-12 13:40:00
429
转载 记录一下爬https站点
schemeRegistry.register(new Scheme("http", 80, PlainSocketFactory .getSocketFactory())); X509TrustManager xtm ...
2012-11-08 14:51:00
131
转载 Apache Mahout 简介
当研究院和企业能获取足够的专项研究预算之后,能从数据和用户输入中学习的智能应用程序将变得更加常见。人们对机器学习技巧(比如说集群、协作筛选 和分 类)的需求前所未有地增长,无论是查找一大群人的共性还是自动标记海量 Web 内容。Apache Mahout 项目旨在帮助开发人员更加方便快捷地创建...
2012-03-13 15:30:00
100
转载 HBase版本匹配问题:HBase-0.90.4与Hadoop-0.20.203.0
转自:http://javoft.net/2011/09/hbase-hmaster-%E6%97%A0%E6%B3%95%E5%90%AF%E5%8A%A8-call-to-failed-on-local-exception/ 前提是HBase-0.90.4与Hadoop-0.20....
2011-12-19 14:49:00
143
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人