- 博客(22)
- 资源 (8)
- 收藏
- 关注
原创 [置顶] 使用nutch检索的历程
最近开始做一个项目的搜索引擎,技术选型为爬虫nutch。开始以为除了cms系统发布的静态页面以外,还有数据库存储的结构化数据需要索引(其实这些用页面是用jsp展示的,在系统中已经有了)。所以用爬虫爬完网站后,就想着再把结构化的数据通lucene的api写进nutch的索引中,最后通过多次尝试发现很难实现。虽然能将lucene建立的索引追加进到nutch的索引中,可是却很难读出来(有一款luke软件
2016-02-23 19:09:40
386
原创 [置顶] hibernate 3.5.6 annotation 双向一对多的配法
今天用hibernate 3.5.6 annotation 双向一对多时候出现了异常,Invocation of init method failed; nested exception is java.lang.NoSuchMethodError:javax.persistence.OneToMany.orphanRemova()Z上网一查发现是ejb3-persistence.jar的问题
2016-02-23 19:09:34
319
原创 [置顶] 换ojdbc14.jar驱动后clob字段后台报异常的解决
换了新驱动ojdbc14.jar对某个表进行新增处理时候报错(在jdk1.5下面)151657 [http-8000-1] ERROR org.springframework.jdbc.support.lob.OracleLobHandler OracleLobHandler.java 417 - Could not free Oracle LOBjava.sql.SQLExceptio
2016-02-23 19:09:29
950
原创 js去除数组的重复元素和去除数组中相邻的重复元素
//去除数组的重复元素Array.prototype.distinct = function(){ var $ = this; var o1 = {}; var o2 = {}; var o3 = []; var o; for(var i=0;o = $[i];i++){ if(o in o1){ if(!(o in o2)) o2[o] = o;
2016-02-23 19:09:18
3473
原创 nutch1.2爬虫在eclipse下运行遇到的问题
最近在研究nutch,将爬虫的源码导入eclipse。参照apache的一个wiki进行了配置。 http://wiki.apache.org/nutch/RunNutchInEclipse1.0 可是运行起单元测试起来会报出异常: 2011-05-27 11:15:46,747 WARN regex.RegexURLNormalizer (RegexURLNo
2016-02-23 19:09:12
340
原创 [转] 用JAVA 实现“生产者-消费者”问题
转自:http://blog.youkuaiyun.com/jaunlee/archive/2008/02/01/2077291.aspx 生产者和消费者问题是从操作系统中的许多实际同步问题中抽象出来的具有 代表性的问题。它反映了操作系统中典型的同步例子。 生产者进程(进程由多个线程组成)生产信息,例如它可以是计算进程。消费 者进程使用信息,它可以是输出打印进程。由于生产者和消费者彼此
2016-02-23 19:09:06
476
原创 [转]nutch1.2断电或者断网后继续爬取的方式
最近用nutch抓取了几个g的数据,爬了两天了。中途要断电,网上找到别人的断点继续爬取的方式,解决了问题。 nutch抓取过程是分阶段的,每个阶段完成后都会写到文件中。附nutch抓取的阶段: (injector) ->generator -> fetcher -> crawldb updater -> linkdb updater -> indexer ->deldup -> merge
2016-02-23 19:09:01
375
原创 浅谈工作流引擎
浅谈工作流引擎一、工作流相关概念工作流(Workflow)是对工作流程及其各操作步骤之间业务规则的抽象、概括描述。工作流建模,即将工作流程中的工作如何前后组织在一起的逻辑和规则,在计算机中以恰当的模型表达并对其实施计算。工作流要解决的主要问题是:为实现某个业务目标,利用计算机在多个参与者之间按某种预定规则自动传递文档、信息或者任务。(维基百科工作流技术 )BPMN(Business Proces
2015-12-28 06:57:40
4145
转载 高性能Mysql主从架构的复制原理及配置详解
温习《高性能MySQL》的复制篇.1 复制概述 Mysql内建的复制功能是构建大型,高性能应用程序的基础。将Mysql的数据分布到多个系统上去,这种分布的机制,是通过将Mysql的某一台主机的数据复制到其它主机(slaves)上,并重新执行一遍来实现的。复制过程中一个服务器充当主服务器,而一个或多个其它服务器充当从服务器。主服务器将更新写入二进制日志文件,并维护文件的一个
2014-02-14 10:12:18
637
js去除数组的重复元素和去除数组中相邻的重复元素
//去除数组的重复元素Array.prototype.distinct = function(){ var $ = this; var o1 = {}; var o2 = {}; var o3 = []; var o; for(var i=0;o = $[i];i++){ if(o in o1){ if(!(o in o2)) o2[o] = o; ...
2011-08-05 10:47:31
505
nutch1.2爬虫在eclipse下运行遇到的问题
最近在研究nutch,将爬虫的源码导入eclipse。参照apache的一个wiki进行了配置。 http://wiki.apache.org/nutch/RunNutchInEclipse1.0 可是运行起单元测试起来会报出异常: 2011-05-27 11:15:46,747 WARN regex.RegexURLNormalizer (Rege...
2011-05-27 11:22:13
176
原创 [转] 用JAVA 实现“生产者-消费者”问题
转自:http://blog.youkuaiyun.com/jaunlee/archive/2008/02/01/2077291.aspx 生产者和消费者问题是从操作系统中的许多实际同步问题中抽象出来的具有 代表性的问题。它反映了操作系统中典型的同步例子。 生产者进程(进程由多个线程组成)生产信息,例如它可以是计算进程。消费 者进程使用信息,它可以是输出打印进程。由于生产者和消费者彼此...
2011-05-17 11:28:20
106
原创 [转]nutch1.2断电或者断网后继续爬取的方式
最近用nutch抓取了几个g的数据,爬了两天了。中途要断电,网上找到别人的断点继续爬取的方式,解决了问题。 nutch抓取过程是分阶段的,每个阶段完成后都会写到文件中。附nutch抓取的阶段: (injector) ->generator -> fetcher -> crawldb updater -> linkdb updater -> indexer -&...
2011-05-12 16:04:05
197
使用nutch检索的历程
最近开始做一个项目的搜索引擎,技术选型为爬虫nutch。开始以为除了cms系统发布的静态页面以外,还有数据库存储的结构化数据需要索引(其实这些用页面是用jsp展示的,在系统中已经有了)。所以用爬虫爬完网站后,就想着再把结构化的数据通lucene的api写进nutch的索引中,最后通过多次尝试发现很难实现。虽然能将lucene建立的索引追加进到nutch的索引中,可是却很难读出来(有一款lu...
2011-04-25 13:47:54
120
原创 hibernate 3.5.6 annotation 双向一对多的配法
今天用hibernate 3.5.6 annotation 双向一对多时候出现了异常,Invocation of init method failed; nested exception is java.lang.NoSuchMethodError:javax.persistence.OneToMany.orphanRemova()Z上网一查发现是ejb3-persistence.jar的...
2011-03-02 15:43:20
122
原创 使用struts2 时候乱码问题的解决。
<br /> 最近自己搭了个hibernate3 +spring3+struts2的框架。发现在jsp到action得到数据时候,出现了乱码。自己写了个过滤器,还是没有用。 在tomcat的server.xml修改URIEncoding='UTF-8'也还是不行。<br /> <br /> 最后网上搜索下,原来struts2需要在struts.xml添加上这么一行,就解决了。<br /> <constant name="struts.i18n.encoding" value="UTF-8"/>
2010-12-28 16:13:00
374
使用struts2 时候乱码问题的解决。
最近自己搭了个hibernate3 +spring3+struts2的框架。发现在jsp到action得到数据时候,出现了乱码。自己写了个过滤器,还是没有用。 在tomcat的server.xml修改URIEncoding='UTF-8'也还是不行。 最后网上搜索下,原来struts2需要在struts.xml添加上这么一行,就解决了。<constant name="struts...
2010-12-28 16:13:00
101
原创 用js实现将float型的科学计数法数字还原为正常写法
function resolveScientificNotation() { var fNumber = 3.2312342E7; alert(new Number(fNumber)); fNumber=3.2312342E7; alert(fNumber.toString()); }
2010-03-25 14:13:00
2494
用js实现将float型的科学计数法数字还原为正常写法
function resolveScientificNotation() { var fNumber = '3.2312342E7'; alert(new Number(fNumber)); fNumber=3.2312342E7; alert(fNumber.toString()); }
2010-03-25 14:13:00
1177
原创 换ojdbc14.jar驱动后clob字段后台报异常的解决
换了新驱动ojdbc14.jar对某个表进行新增处理时候报错(在jdk1.5下面)151657 [http-8000-1] ERROR org.springframework.jdbc.support.lob.OracleLobHandler OracleLobHandler.java 417 - Could not free Oracle LOBjava.sql.SQLExce...
2010-01-29 13:27:42
247
Dubbo和微店的服务化历程分享.pdf
2019-07-24
工作中非常有用的工具sql语句
2010-09-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人