自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(67)
  • 资源 (7)
  • 收藏
  • 关注

转载 Compute PI in parallel

In this article, we use two methods to compute PI: integration and Monte Carlo. And it also has OpenMP and MPI version.

2011-02-21 08:48:00 984

转载 fstream ifstream ofstream的使用

ofstream是从内存到硬盘,ifstream是从硬盘到内存,其实所谓的流缓冲就是内存空间;在C++中,有一个stream这个类,所有的I/O都以这个“流”类为基础的,包括我们要认识的文件I/O,stream这个类有两个重要的运算符:1、插入器(>)  从流中输入数据。比如说系统有一个默认的标准输入流(cin),一般情况下就是指的键盘,所以,cin>>x;就表示从标准输入流中读取一个指定类型(即变量x的类型)的数据。  在C++中,对文件的操作是通过stream的子类fstream(fil

2010-11-23 03:56:00 1456

转载 文件操作EOF()的问题

eof()函数的问题

2010-11-23 03:55:00 849

转载 Java中使用遍历文件夹的2种方法

A.不使用递归import java.io.File;import java.util.LinkedList;public class FileSystem {    public static void main(String[] args) {        long a = System.currentTimeMillis();        LinkedList list =

2010-03-21 11:02:00 547

转载 Myeclipse中出现java.lang.UnsupportedClassVersionError: Bad version number in .class file错误

造成这种错误的原因是你的支持Tomcat运行的JDK版本与支持application运行的JDK版本不一致导致的.那么如何解决上面的问题呢?办法显而易见:把它们的JDK版本改成一致.步骤如下:1.Window --> Preferences -->Java --> compiler中的compiler compliance level对应的下拉菜单中选择JDK版本.2.Wind

2010-03-19 22:00:00 1523

转载 Servlet与JSP中页面跳转的区别

一直对Servlet的几种页面跳转方式,理解的糊里糊涂的,今天在网上搜了一把,找到一遍比较好的,记下来,以后看看。   跳转分两部分,一是发生在servlet,一是在JSP,其实JSP也就是servlet,不过还是有点差异滴。 Servlet: 当然,在servlet中,一般跳转都发生在doGet, doPost等方法里面。 1)  redirect 方式 response.sendRedirec

2010-03-01 22:00:00 1390

原创 JS调用后台带参数的方法

对于前台调用后台的方法,我们想到最多的就是用AJAX,这个是毋庸置疑的, 我就不再这里多说了。我今天主要想说的是用JS调用后台的方法。对于后台往前台传值,用这种 方法,我们是在熟悉不过了,由此,我们是否可以用同样的办法达到传值方法返回值的效果呢?我在这个项目中最先想到的就是尝试这种(因为这个项目用到了VML,用AJAX以前是不行,不过,后来测试还是没有问题,不过,需要把xmlns=http://w

2010-01-03 14:37:00 5777

转载 Nutch1.0源码分析-----抓取部分

  document.body.oncopy = function() { if (window.clipboardData) { setTimeout(function() { var text = clipboardData.getData("text");

2009-11-08 16:44:00 2402 1

转载 分布式计算开源框架Hadoop入门实践(二)

 其实参看Hadoop官方文档已经能够很容易配置分布式框架运行环境了,不过这里既然写了就再多写一点,同时有一些细节需要注意的也说明一下,其实也就是这些细节会让人摸索半天。Hadoop可以单机跑,也可以配置集群跑,单机跑就不需要多说了,只需要按照Demo的运行说明直接执行命令即可。这里主要重点说一下集群配置运行的过程。环境7台普通的机器,操作系统都是Linux。内存和CPU就不说了,反正Hadoop

2009-11-08 09:40:00 599

转载 分布式计算开源框架Hadoop入门实践(一)

 在SIP项目设计的过程中,对于它庞大的日志在开始时就考虑使用任务分解的多线程处理模式来分析统计,在我从前写的文章《Tiger Concurrent Practice --日志分析并行分解设计与实现》中有所提到。但是由于统计的内容暂时还是十分简单,所以就采用Memcache作为计数器,结合MySQL就完成了访问控制以及统计的工作。然而未来,对于海量日志分析的工作,还是需要有所准备。现在最火的技术词

2009-11-08 09:37:00 649

转载 Ubuntu设置静态IP,解决重启后需要重新设置的问题

 Ubuntu 8.10 默认是gnome,默认是DHCP自动获取IP。设定好静态IP,重启了也会变。1。设定IPsudo gedit  /etc/network/interfacesauto loiface lo inet loopback            #lo 是本地回环地址:127.1auto eth0 iface eth0 inet static address 192

2009-11-04 21:09:00 2280

转载 OpenSSH提升系统安全性

 OpenSSH 是 SSH (Secure SHell) 协议的免费开源实现。它用安全、加密的网络连接工具代替了 telnet、ftp、 rlogin、rsh 和 rcp 工具。OpenSSH 支持 SSH 协议的版本 1.3、1.5、和 2。自从 OpenSSH 的版本 2.9 以来,默认的协议是版本 2,该协议默认使用 RSA 钥匙。 1. 为什么使用 SSH? 使用 OpenS

2009-11-04 21:06:00 614

转载 ubuntu设置环境变量错误导致系统无法登录

  您的会话只持续了不到10秒钟。如果您没有注销,这就意味着安装可能出现了问题,或者您的磁盘空间已耗尽。可以试试以某个安全模式会话登录,以便查看是否可以解决此问题。查看细节(~/.xsession-errors文件)/etc/gdm/Xsession:Beginning session setup…/etc/profile:26:id:not found[:26:Illegal numbe

2009-11-01 19:07:00 853

转载 problem installing JDK on debian

 先下载了个jdk-6u5-linux-i586-rpm.bin 照着网上说的用root用户执行了 chmod +x jdk-6u5-linux-i586-rpm.bin //所有用户可以执行sudo ./jdk-6u5-linux-i586-rpm.bin //执行结果输出:Sun Microsystems, Inc. Binary Code Lice

2009-10-30 14:23:00 705

转载 在SuSE 10.2下安装JDK环境

 下面说说怎么样安装JDK环境。  JDK下载  首先可以从下面的联结下载最新的JDK版本:   http://java.sun.com/javase/downloads/index.jsp  现在linux的版本是jdk-6u1-linux-i586.bin 或jdk-6u1-linux-i586-rpm.bin  可以选择其中的任何一个下载。  安装  1,把下载了

2009-10-28 20:23:00 534

转载 nstalling Sun JDK 5.0, Eclipse WTP, Apache Tomcat 5.5, and ANT 1.6.x on Novell SuSE 10

Steps Involved:Install JDKDownload and install JDK RPM from Sunlog in as rootexecute shell script to unpack binary RPM: ./jdk-1_5_0_06-linux-i586.rpm.binnow you have an

2009-10-28 15:47:00 647

转载 Tomcat内存,连接数等性能参数设置

关键字: tomcat 性能调优 中间件 服务器 默认参数不适合生产环境使用,因此需要修改一些参数1、修改启动时内存参数、并指定JVM时区 (在windows server 2008 下时间少了8个小时): 在Tomcat上运行j2ee项目代码时,经常会出现内存溢出的情况,解决办法是在系统参数中增加系统参数: window下, 在catalina.bat最前面:set JAVA

2009-10-25 13:48:00 947

原创 教育网中Nutch如何抓取国外网站

对于大多数教育网中的用户,都是不可以直接上国外网站的(主要由于学校封锁),一定要上的话也只能通过代理。今天我需要抓取一些国外的网站,但发现全部都抓取不成功。经过检查发现需要设置代理,具体设置方法如下:在/conf/nutch-site.xml中添加如下内容:  http.proxy.host  ***.***.***.***  The proxy hostname.  If empty,

2009-10-20 11:32:00 1173

转载 使用jad反编译class文件

jad:反编译工具 可以将class文件反编译成java文件 假设将jad.exe安装在f:/java/jad目录下 如果*.class文件和jad程序不在同一个目录,就要用到path环境变量, 将jad 所在目录加到path路径中即可:set path=%path%;f:/java/jad 若要了解jad更为详细的使用帮助信息,直接运行jad.exe查看   1.反编译单个文件

2009-08-27 11:26:00 1265

转载 Nutch二次开发总结(二)

 3搜索结果优化使用nutch 0.9自带的程序包搜索的时候,存在一个冗余数据的情况。例如,如果想搜索关于姚明、易建联等的信息时,nutch默认会把网页中导航条或者一些标题等中包含姚明和易建联信息的页面检索出来,以腾讯为例,http://sports.qq.com/nba/的导航条部分包含了姚明和易建联。但这个页面的其他信息没有设计到姚明和易建联,所以这个页面可能实际上不是我们想要的;还有一种

2009-07-14 19:52:00 1215

转载 Nutch二次开发总结(一)

通过一系列的离线活动(对于查询用户而言)的开展,Nutch检索系统相对而言变得简单了许多。在二次开发的时候,需要重点对Nutch的界面及界面显示数据进行适当的调整。1 摘要提取1.1 摘要提取源码分析**      * Low level api to get the most relevant (formatted) sections of the document.     * 底层API

2009-07-14 19:51:00 1115

转载 lucene总结

搜索引擎知识总结1:搜索引擎按原理和工作方式可分为:A:爬虫式,主要用Socket实现,基于TCP/IP协议B:目录索引式,以早期的yahoo为代表C:元搜索引擎,即将多个搜索引擎的结果合并返回 2:按领域范围可分为:A:通用搜索引擎---针对全互联网全部网站和各种数据信息,信息全,领域广B:垂直搜索引擎---针对果某一行业,如企业库搜索,供求信息搜索,房产搜索

2009-07-13 19:19:00 1859

转载 Cygwin的安装

关于cygwin的安装: 1. 最好不要到www.cygwin.com下载cygwin..也就是说不要从Internet上安装cygwin,而要从本地安装(PS:往往千奇百怪的错误就是因为从internet下载的cygwin的版本引起的)。,从这里下载http://140.116.72.80/~smallko/ns2/ns_setup.rar 。我一开始就是使用的从网上下载的那个setup.exe

2009-07-12 19:39:00 951

转载 对Jena的简单理解和一个例子

本文简单介绍Jena(Jena 2.4),使用Protégé 3.1(不是最新版本)创建一个简单的生物(Creature)本体,然后参照Jena文档中的一个例子对本体进行简单的处理,输出本体中的Class、Property等信息。本文内容安排如下:Ø         介绍JenaØ         运行JenaØ         Jena Ontology APIØ      

2009-07-06 17:00:00 1662

转载 中文本体持久化到Mysql数据库的乱码问题

相信这应当不是个复杂的问题,但是困扰了我整整一个下午的时间,目前尚没有解决。毕设第一阶段的工作大概可以说是完成了,进行了一些简单的测试,目前比较明显的问题是中文的支持。先写下程序中数据的流动过程,然后再细想到底是哪个环节出了问题:首先考虑的是Protege,我用它来创建本体,在斯坦福的ProtegeFAQ看到Protege为了便于共享,因此默认支持的UTF-8的编码方式,而非根据系统而

2009-07-06 16:58:00 1049

转载 使用Jena将本体存入MySQL——文档和例子(zz)

 注明:本文档参考Jena 2.5文档,使用Jena 2.5 API和MySQL 5.0.4-beta-nt数据库。MySQL驱动包使用的是mysql-connector-java-3.1.10-bin.jar。1 Jena的数据库接口Jena提供了将RDF数据存入关系数据库的接口,Model、Resource、Query等接口可以用于访问和维护数据库里的RDF数据。在处理数据时,应用

2009-07-06 16:53:00 2140

转载 csdn的精华网址

1、DataGrid动态模板列更新数据并且分页的例子 http://www.cnblogs.com/lovecherry/archive/2005/03/26/126102.html 2、DataGrid动态添加模板列的一个例子 http://www.cnblogs.com/lovecherry/archive/2005/03/25/125526.html 3、DataGrid实现增删(带

2009-06-17 16:58:00 3703 1

转载 jena学习思路

在用protege建好本体之后,下一步便是需要对本体进行解析.本体解析有许多思路和工具可以使用,甚至可以自己编写本体解析的模块.jena是由HP实验室开发的模块,用于支持语义网应用.为了学习和使用jena,我的确已经花费了不少时间.因为对这个东东一点都不了解,在网上搜集一些信息,比较杂乱,不知从何开始.现在对这个问题已经有了一些了解,总结一些学习思路,以供参考,避免初学者象我最初一样在搜集和删

2009-06-04 13:08:00 3113 1

转载 Nutch-0.9源代码:Crawl类整体分析

Nutch-0.9中,org.apache.nutch.crawl.Crawl类中提供了一个入口主函数main,通过接收键入的命令行,根据命令行指定的参数对Nutch进行配置,从而启动Nutch抓取程序,通过阅读org.apache.nutch.crawl.Crawl类的源代码来了解Nutch是如何根据接收的命令行进行配置及其启动的。org.apache.nutch.crawl.Crawl类的

2009-05-28 23:17:00 1131 4

转载 Nutch开源搜索引擎的crawl日志分析及工作目录说明

看了nutch关于crawl的源码后,我将crawl的日志分析了一下,主要是熟悉一下整个下载、分析、索引的过程。nutch在整个过程中都是通过Hadoop的MapReduce来实现的。 可以通过nutch来深入学习Hadoop编程,都是比较横的代码。这一块待以后研究完毕后,blog出来。 crawl通过nutch-default.xml参数来控制运行过程,另外需要修改crawl-urlfilter

2009-05-28 23:15:00 823

转载 潜在语义索引-搜索引擎原理

 隐含语义索引LSI-搜索引擎原理有些事情我们一直在思考,比如搜索引擎是如何来判断文章的原创?文章是否有关键词堆积?那么搜索引擎又是如何来判断文章和关键词的相关性的呢?还有很多朋友都很疑惑的一个问题,因为大家都知道Google的排名算法PR,好像现在不起作用了,因为很多SEOER都跟我说,很多PR高的在某些关键词排名反而落后于PR值很低的站点。所以大部分的朋友认为是不是PR现在已经

2009-05-26 18:28:00 1789

转载 java去除字符串中的空格、回车、换行符、制表符

java去除字符串中的空格、回车、换行符、制表符,本方法采用的是java的正则表达式  import java.util.regex.*;   public class StringUtil {  public static void replaceBlank(){   Pattern p = Pattern.compile(“//s*|/t|/r|/n

2009-05-21 17:34:00 1261

原创 submit与button的区别

 Submit是专门用于提交表单的Button,与Button的区别主要有两点:     (1)Submit将表单提交(form.submit())作为其onclick后的默认事件,Button并非如此。这一点是地球人都知道的。    (2)表单提交时,所有具有name属性的html输入元素(包括input标签、button标签、select标签等)都将作为键值对提交,除了Submit对象。S

2009-05-21 17:04:00 3764 1

转载 DWR使用笔记

 DWR是一个框架,简单的说就是能够在javascript直接调用java方法,而不必去写一大堆的javascript代码。它的实现是基于ajax的,可以实现无刷新效果。    网上有不少DWR的例子,但大都只是某种方法的调用,本文只在使用层面上介绍DWR,并不涉更多的技术与设计,其目的是让初学者能够很快的学会各种java方法在javascript中是如何调用的。     本文以DWR 1

2009-05-21 13:46:00 511

转载 初学DWR3.0

 Getting Started with DWRThere are 2 ways to get started with DWR, the easy way is to download the WAR file and have a look around, however this does not help you see how easily DWR integrates wit

2009-05-21 13:26:00 1727

转载 学习DWR框架的一个实例

1.       服务器端代码首先创建JavaBean,输入下列代码:package test;public class Login {    public String Check(String name,String password) {        if(name.trim().equals("liu") && password.trim().equals("aa")

2009-05-21 12:52:00 1124

转载 util.js文件介绍

 Util.js文件Util.js文件包含了一些工具函数,来帮助人们使用JavaScript数据(例如从服务器返回的数据)来更新Web页面。可以再DWR框架以外使用它,因为它不依赖于DWR的其他部分,并可以下载整个DWR框架或者单独下载。       Util.js文件包含了下面几个基本函数,分别为getValue[s](), setValue[s](), getText(), add

2009-05-21 12:49:00 14702

转载 nutch1.0中索引的更新和维护

1、写一个维护脚本,定时运行,是个好办法 #!/bin/bash # Set JAVA_HOME to reflect your systems java configurationexport JAVA_HOME=/usr/lib/j2sdk1.5-sun # Start index updation,只查找最热门的前1000条记录,由此创建新的segmentbin/nutch gener

2009-05-11 13:46:00 883

原创 在Eclipse中运行Nutch1.0

Run Nutch In Eclipse on Linux and Windows nutch version 1.0Tested withNutch release 1.0 Eclipse 3.3Java 1.6 Ubuntu (should work on most platforms though) Windows XP StepsFor Window

2009-05-09 14:49:00 2781

转载 Nutch1.0的配置与运行

配置软件:1、 Java jdk-1.61.1 下载安装from: http://www.sun.com安装目录:C:/Java/jdk1.6.0_031.2 修改环境变量JAVA_HOME=C:/Java/jdk1.6.0_03/bin CLASSPATH=C:/Java/jdk1.6.0_03/lib/dt.jar;C:/Java/jdk1.6.0_03/lib/tools

2009-05-08 19:43:00 2074

struts2-3-1常用包

struts2-3-1常用包,包括Struts-spring-hibernate平台开发的常用包

2011-12-23

Jena API chm格式

Jena API chm格式, 用于对本体进行解析等操作

2009-07-16

Nutch1.0的API chm格式

Nutch1.0的API,不过注意没有搜索功能

2009-07-16

一个简单的分词系统(可以选择正向最大匹配分词或逆向最大匹配)

使用正向最大匹配FMM分词 以及逆向最大匹配BMM分词 但不是同时使用

2009-03-03

文本的预处理程序,包括如何断句等(非常准确)

1. 删除文件中的中文、西文空格 2. 将篇章切分为一个个的句子,切分标志为:。 ! ? … ;等,句中如果有引号,要求左右匹配 3. 对句子按长度从大到小分行排序。 4. 在每行句子前加上序号 5. 统计一个文件中各种长度的句子的频次,按照句长频次降序输出统计结果

2009-03-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除