自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(109)
  • 收藏
  • 关注

原创 JVM调优总结

一、相关概念 基本回收算法 引用计数(Reference Counting)比较古老的回收算法。原理是此对象有一个引用,即增加一个计数,删除一个引用则减少一个计数。垃圾回收时,只用收集计数为0的对象。此算法最致命的是无法处理循环引用的问题。 标记-清除(Mark-Sweep)此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标...

2009-04-09 16:08:48 236

原创 JProfiler学习笔记

JProfiler学习笔记一、安装JProfiler       从http://www.ej-technologies.com/下载5.1.2并申请试用序列号 二、主要功能简介...

2009-03-06 16:22:10 255

hadoop学习

MapReduce: Simplified Data Processing on Large Clusters http://labs.google.com/papers/mapreduce.html HTML:http://labs.google.com/papers/mapreduce-osdi04-slides/index.html Downloading and insta...

2008-06-27 16:54:04 210

Map Reduce - the Free Lunch is not over?

原文出处:http://www.mengyan.org/blog/archives/2006/11/15/138.html微软著名的C++大师Herb Sutter在2005年初的时候曾经写过一篇重量级的文章:”The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software“,预言OO之后软件开发将要面临的...

2008-06-05 18:12:10 228

Hadoop学习笔记

原文出处:http://blog.youkuaiyun.com/heiyeshuwu/archive/2007/09/09/1778193.aspx 一、简要介绍这里先大致介绍一下Hadoop.    本文大部分内容都是从官网Hadoop上来的。其中有一篇介绍HDFS的pdf文档,里面对Hadoop介绍的比较全面了。我的这一个系列的Hadoop学习笔记也是从这里...

2008-06-05 17:54:01 105

Nutch项目配置2---外部网搜索(原)

首先看一下Nutch的整个工作流程下面解析http://lucene.apache.org/nutch/tutorial8.html中关于外部网搜索的部分中所描述的内容:Whole-web: Boostrapping the Web DatabaseThe injector adds urls to the crawldb. Let's inject URLsfrom the D...

2008-06-05 16:47:15 259

几篇感兴趣的文章

均是江南白衣的: http://blog.youkuaiyun.com/calvinxiu/archive/2005/11/18/532123.aspx http://blog.youkuaiyun.com/calvinxiu/archive/2005/10/26/516920.aspx http://blog.youkuaiyun.com/calvinxiu/archive/2005/06/16/395885.aspx...

2008-04-14 16:33:22 111

HashCode

所有对象的超类Object中有一个HashCode()方法,但是它和equals方法一样,并不能适用于所有的情况。 Object中的HashCode方法返回的HashCode对应于当前的地址,也就是说对于不同的对象,即使它们的内容完全相同,用HashCode()返回的值也会不同。  为什么HashCode对于对象是如此的重要?  对于一个象,如果具有很多属性,把所有属性都参与散列,显然是一种笨拙的...

2008-02-16 18:04:05 100

HashMap

1、在数组中我们是通过数组下标来对其内容索引的,而在Map中我们通过对象来对对象进行索引,用来索引的对象叫做key,其对应的对象叫做value。2、HashMap通过hashcode对其内容进行快速查找,而TreeMap中所有的元素都保持着某种固定的顺序,如果你需要得到一个有序的结果你就应该使用TreeMap(HashMap中元素的排列顺序是不固定的)。3、在HashMap中通过get()来获取v...

2008-02-16 17:55:27 103

HTML中小meta

 meta是用来在HTML文档中模拟HTTP协议的响应头报文meta 标签用于网页的<head>与</head>中meta 的属性有两种:name属性:要用于描述网页,对应于content(网页内容),以便于搜索引擎机器人查找、分类(目前几乎所有的搜索引擎都使用网上机器人自动查找meta值来给网页分类),这其中最重要的是descrip...

2008-02-15 11:58:20 140

排序--归并排序

原理:1、算法基本思路     设两个有序的子文件(相当于输入堆)放在同一向量中相邻的位置上:R[low..m],R[m+1..high],先将它们合并到一个局部的暂存向量R1(相当于输出堆)中,待合并完成后将R1复制回R[low..high]中。(1)合并过程     合并过程中,设置i,j和p三个指针,其初值分别指向这三个记录区的起始位置。合并时依次比较R[i]和R[j]的关键字,...

2007-11-16 17:06:10 99

排序--快速排序

快速排序利用分治策略原理:取数组中的一个值pivot做为基准值,对数组分治,小于pivot分为一组,大于pivot分为一组递归对每个分组继续分组,直到分组中只有一个元素主要包括两个步骤1: 以一个基准值为中心,把数组分成两组2: 对每个分组递归分组,直到分组元素只有一个实现: private static int partition(int[] array, int low, ...

2007-11-16 17:05:07 99

排序--冒泡排序

原理:将被排序的记录数组R[1..n]垂直排列,每个记录R[i]看作是重量为R[i].key的气泡。根据轻气泡不能在重气泡之下的原则,从下往上扫描数组R:凡扫描到违反本原则的轻气泡,就使其向上"飘浮"。如此反复进行,直到最后任何两个气泡都是轻者在上,重者在下为止实现: private static void swap(int[] array, int i, int j) {  in...

2007-11-16 17:03:06 110

排序--插入排序

插入排序包括: 直接插入排序,希尔排序1. 直接插入排序原理:依次取带排列数组的元素,将其插入到前面有序的数组中。插入过程:待插入关键字与有序数组最后一位比较,如果小于则将数组最后一位右移,直到关键字小于数组元素时,将关键字放置在当前空的位置,则新的数组有序。实现:   public static void insertSort(int[] array) {  int n = a...

2007-11-16 17:02:02 110

算法--排序

排序算法的总结:     所谓排序,就是要整理文件中的记录,使之按关键字递增(或递减)次序排列起来。其确切定义如下:输入:n个记录R1,R2,…,Rn,其相应的关键字分别为K1,K2,…,Kn。输出:Ril,Ri2,…,Rin,使得Ki1≤Ki2≤…≤Kin。(或Ki1≥Ki2≥…≥Kin)。排序的稳定性    当待排序记录的关键字均不相同时,排序结果是惟一的,否则排序结果不唯一。...

2007-11-16 17:00:56 105

字符编码(转)

今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。 下面就是我的笔记,主要用来整理自己的思路。但是,我尽量试图写得通俗易懂,希望能对其他朋友有用。毕竟,字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得一点字符编码的知识。1. ASCII码 我们知道,在计算机内部,所有的信...

2007-10-30 10:51:08 144

Java正则表达式详解

如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一个用来搜索匹配字符串的模式。 许多语言...

2007-10-12 17:50:25 89

正则表达式学习笔记-车东

正则表达式学习笔记  正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。  列目录时, dir *.txt或ls *.txt中的*.txt就不是一个正则表达式,因为这里*与正则式的*的含义是不同的。  为便于理解和记忆,先从一些概念入手,所有特殊字符或字符组合有一个总表...

2007-10-12 17:41:03 136

正则表达式30分钟入门教程

本文目标30分钟内让你明白正则表达式是什么,并对它有一些基本的了解,让你可以在自己的程序或网页里使用它。一旦入门后,你可以从网上找到更多更详细的资料来继续学习。别被下面那些复杂的表达式吓倒,只要跟着我一步一步来,你会发现正则表达式其实并不像你想像中的那么困难。当然,如果你看完了这篇教程之后发现自己明白了很多,却又几乎什么都记不得,那也是很正常的--其实我认为没接触过正则表达式的人在看完这篇教程...

2007-10-12 17:38:23 108

Lucene 基础指南

Lucene是apache组织的一个用java实现全文搜索引擎的开源项目。其功能非常的强大,但api其实很简单的,它最主要就是做两件事:建立索引和进行搜索。1. 建立索引时最重要的几个术语* Document:一个要进行索引的单元,相当于数据库的一行纪录,任何想要被索引的数据,都必须转化为Document对象存放。* Field:Document中的一个字段,相当于数据库中的Column ...

2007-09-21 11:55:40 149

Lotus 权限控制

Notes的权限设置很多,最主要的有:先服务器级的权限设置(在服务器文档中设置),再是数据库级的权限设置(在ACL中设置),再是文档级的权限设置(文档的读者域和作者域)另外Lotus的权限设置除了深入到文档级别外,在文档内部还可以根据段落或域(Field)来设置权限。1、存取级别——共七级(1)不能存取者:对数据库没有操作权限,包括不能将数据库的图标添加到工作台上(2)存放者:...

2007-07-26 16:49:43 476

搜索引擎技术及趋势- -

随着因特网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就象大海捞针一样,搜索引擎技术恰好解决了这一难题(它可以为用户提供信息检索服务)。目前,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。   搜索引擎(Search Engine)是随着WEB信息的迅速增加,从1995年开始逐渐发展起来的技术。据发表在《科学》杂志1999年7月的文章《WEB信息的可访问性》估计,全球...

2007-07-03 18:10:26 208

搜索引擎

一、综合搜索引擎1搜索界的霸主——googlehttp://www.google.com/2中国的霸者——百度搜索http://www.baidu.com/3搜索巨无霸——一搜http://www.yisou.com/4搜索的联盟——中搜http://www.zhongsou.com/5天职是搜索——搜狗http://www.sogou.com/6问尽天下事——爱问...

2007-07-03 17:47:03 156

海量DESE推动企业级中文搜索引擎走向成熟

全文检索逸事   10G、20G、40G、80G……,近年,企业网络系统内,服务器的硬盘在以N次方的速度频繁升级,而职员却永远在抱怨机器如同老牛拖货车,“慢”得令人无法忍受。   有关调查结果显示,当前,对“基于内容搜索的文件系统”成为用户的迫切要求。在几乎所有企业所构建的网络系统中,“全文检索”功能已成客户开发应用平台的重要部分。   另外,互联网有关资深专家也声称:“中国企业信息化热...

2007-06-15 16:31:58 225

DESE:一步到位的企业级搜索引擎解决方案

嵌入式数据库搜索引擎(DESE德思,Database-based Embedded Search Engine)融合了数据库完善的数据管理功能和搜索引擎高效的信息查找功能,实现了结构化数据和非结构化数据的统一管理和完美查询。  只要系统中存在数据库,DESE就可以迅速在系统中实现搜索引擎,保留数据原有的安全机制,对系统中的所有文本信息实现快速、准确的搜索。  信息搜索市场的有力的推动者DESE...

2007-06-15 16:21:34 1020

微软和海量科技合作 推企业搜索引擎新方案

天极网 消息 记者近日获悉,微软中国公司与天津海量科技发展有限公司(海量科技)达成合作意向,微软中国公司协助海量科技在中国大陆地区推广企业级中文搜索引擎新解决方案-DESE(嵌入式数据库搜索引擎SQL Server版本)。  微软(中国)有限公司业务拓展经理张谦表示,选择海量科技作为认证级合作伙伴是看重海量科技对微软产品的增值能力和技术实力。在市场推广期, DESE(德思)会绑定SQL SER...

2007-06-15 16:17:43 638

甲骨文结合数据库优势 推出安全企业级搜索引擎

据海外最新消息,帮助企业找到近在咫尺的数据意味着巨大的财富,而甲骨文公司正是这一领域的好手,这让其他较小企业搜索服务提供商嫉妒不已。 在3月1日,甲骨文公司推出了自己最新的安全企业搜索引擎,这一产品能够在符合企业规章和敏感数据限制的基础上查找到企业数据库中的一丝一毫信息。 第10代甲骨文安全企业搜索引擎能够在完全符合企业安全政策的前提下对企业内外部数据进行详细查找和索引。 甲骨文公司如...

2007-06-15 16:16:41 268

读者域作者域问题

读者域:   如果希望限定对由某个表单所创建的特定文档的存取,则在表单中添加一个“读者”域。“读者”域清楚地列出了可以阅读由此表单所创建的文档的用户。例如:如果限制某个员工的人事档案只有“人力资源”部门的成员、员工本人以及员工的经理可以存取,则可将这些人员列在“读者”域中。对文档不具有“读者”权限的用户则不能在视图中查看文档。          如果表单中有存取列表,那么“读者”域中的姓名...

2007-06-12 16:16:26 159

Lotus Domino/Notes 数据库、文档的权限控制

Domino 的数据库、文档权限控制(按优先级排序):1. 基本原则:可见才可编辑2. 基本原则:用户的数据库个人权限优先级>用户所属群组数据库权限的优先级>default数据库权限优先级3. 基本原则:读者域只有在用户数据库权限大于等于读者时才起作用,作者域只有在用户数据库权限大于等于作者时才起作用。4. 数据库基本权限:  4.1 数据库权限小于读者时:文档不可见。  ...

2007-06-12 14:47:34 533

OA走向知识管理(转)

这几天,“非典”疫情正在一天天地好转,我们的心情也在渐渐地好起来。已经习惯了远程办公的SOHO一族们,已经深深感到协同办公软件在这个非常时期所带来的便利:不仅可以轻而易举地实现单位内部各组织、各部门以及人员之间的协同,还能够方便地与外部的各种资源结合在一起。而接下来的问题就是:我们如何从现有的OA系统中挖掘更多的信息、创造更多的价值?来自专家的答案是引入知识管理思想。这就是我们通常所说的以知识管...

2007-05-29 18:03:17 278

LotusDomino环境下编写Web浏览器多数据库检索程序

随着计算机技术的日益普及,Internet/Intranet技术得到了更加广泛的应用,在世 界范围的大量Web网点上以及公司内部的Web服务器上,都存放着大量的信息。为使这些信 息得到的合理使用,Web服务器管理员应该为用户提供方便的信息检索方法。作为群件代 表的Lotus Domino 4.5集成了邮件处理、群件应用和Internet出版等功能,是Notes技术向Internet/ I...

2007-05-29 17:50:46 241

OA++中基于Notes平台上浏览器的开发

莲花(Lotus)公司的群件产品Lotus Domino/Notes 自推出之后,备受大家的关注和关爱。经过不断的发展、不断成熟,目前其最新版本4.6x已是一个相当可靠、稳定、友好、健壮的系统。 Domino/Notes是一套以邮件为基础的数据库平台,其处理文档型数据的功能尤其强大。利用表单、视图、导航 器等设计元素,以及公式、Lotus Script等代码方式,它将数据库及代码揉和在一起,...

2007-05-29 17:40:30 302

用Yale CAS Server 来实现单点登陆(SSO)-转载

CAS (Central Authentication Service)是Yale大学的ITS开发的一套JAVA实现的开源的SSO(single sign-on)的服务。这里用一个简单的例子来说明用CAS来实现单点登陆(SSO)。Yale CAS Server 的配置过程CAS (Central Authentication Service)是Yale大学的ITS开发的一套JAVA实现的开...

2007-05-21 13:04:37 147

Notes数据库——文档数据库探究

美国Lotus公司(已被IBM公司兼并)于八十年代后期推出的群组工作软件(群件)——Lotus Notes/Domino是一种基于Internet/Intranet技术为构架的群件系统,运行模式不但有客户机/服务器(Client/Server),而且有浏览器/服务器(Browser/Server),是构造企业信息网主要工具之一。现已被广泛应用于办公自动化、工作流控制、协同工作环境等方面,它提供了功...

2007-05-21 13:03:48 135

Java/J2EE中文问题终极解决之道

Java中文问题一直困扰着很多初学者,如果了解了Java系统的中文问题原理,我们就可以对中文问题能够采取根本的解决之道。  最古老的解决方案是使用String的字节码转换,这种方案问题是不方便,我们需要破坏对象封装性,进行字节码转换。  还有一种方式是对J2EE容器进行编码设置,如果J2EE应用系统脱离该容器,则会发生乱码,而且指定容器配置不符合J2EE应用和容器分离的原则。  在Java内...

2007-05-21 13:02:54 76

61条面向对象设计的经验原则

“你不必严格遵守这些原则,违背它们也不会被处以宗教刑罚。但你应当把这些原则看成警铃,若违背了其中的一条,那么警铃就会响起。” ----------Arthur J.Riel(1)所有数据都应该隐藏在所在的类的内部。(2)类的使用者必须依赖类的共有接口,但类不能依赖它的使用者。(3)尽量减少类的协议中的消息。(4)实现所有类都理解的最基本公有接口[例如,拷贝操作(深拷贝和浅拷贝)、相等性...

2007-05-21 11:12:26 71

jdbc连接各数据库的方法

1、Oracle8/8i/9i数据库(thin模式) Class.forName("oracle.jdbc.driver.OracleDriver").newInstance(); String url="jdbc:oracle:thin:@localhost:1521:orcl"; //orcl为数据库的SID String user="test"; String password=...

2007-05-21 11:10:31 87

垂直搜索

垂直搜索引擎技术一、互联网信息采集与处理检索系统1.         新闻搜索引擎SPIDER2.         网页搜索引擎SPIDER3.         定向专业搜索SPIDER4.         基于视觉的正文智能提取模块(自动正文提取)5.         智能摘要提取模块6.         去重模块7.         智能分类模块8.         检索前...

2007-05-21 11:00:24 277

Nutch应用

Nutch作为一款刚刚诞生的开源Web搜索引擎,提供了除商业搜索引擎外的一种新的选择。个人、企业都可通过Nutch来构建适合于自身需要的搜索引擎平台,提供适合于自身的搜索服务,而不必完全被动接收商业搜索引擎的各种约束。 Nutch的工作流程可以分为两个大的部分:抓取部分与搜索部分。抓取程序抓取页面并把抓取回来的数据进行反向索引,搜索程序则对反向索引进行搜索回答用户的请求,索引是联系这两者的纽带。...

2007-05-21 10:57:15 146

搜索引擎资料收集(转)

搜索引擎学习资源收集一、搜索引擎技术/动态资源<一>、综合类1、卢亮的搜索引擎研究 http://www.wespoke.com/卢亮属于搜索引擎开发上的专家,以前开发过一个搜索引擎"博索"(http://booso.com/),好像现在已经停止开发了,目前他服务于博客网。在他的这个blog上可以了解许多搜索引擎开发的技术和经验,值得持续关注。2、laolu'...

2007-05-21 10:42:14 469

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除