hellocdw-优快云博客

转载关于Java类加载双亲委派机制的思考（附一道面试题）

预定义类加载器和双亲委派机制JVM预定义的三种类型类加载器：启动（Bootstrap）类加载器：是用本地代码实现的类装入器，它负责将/lib下面的类库加载到内存中（比如rt.jar）。由于引导类加载器涉及到虚拟机本地实现细节，开发者无法直接获取到启动类加载器的引用，所以不允许直接通过引用进行操作。标准扩展（Extension）类加载器：是由 Sun 的ExtClassL

2015-06-28 20:27:05 840

原创 sftp使用

在sftp中get表示下载远程文件到本地； put表示上传本地文件到远程sftp> get 远程主机下文件的路径将文件保存到本地电脑的路径sftp> put 本地文件的路径将文件版保存到远程主机的路径但是get和put只能处理文件，对与文件夹的情况则用mget和mput命令：mget -r /home/q/home/test/solr/ /home/test/stud

2015-05-16 18:00:48 1783

原创 Mybatis参数传递总结

单个参数传递的情况：用parameterType指定传入参数类型publicList getXXBeanList(String xxCode);<selectid="getXXXBeanList"parameterType="java.lang.String"resultType="XXBean">　　selectt.* from tableName t where t

2015-04-24 17:12:10 581

原创如何在filter中拿到spring容器

public class OriginFilter implements Filter { private ServletContext servletContext; final private Logger logger = LoggerFactory.getLogger(getClass()); @Override public void

2015-04-15 17:10:18 1267

转载如何正确地处理时间

日期和时间在程序中应用广泛，每种程序开发语言都自带处理日期和时间的相关函数，很多开发者把日期和时间存入数据库中，但是，一旦涉及到跨时区的日期和时间的处理时，大多数开发者根本就不明白如何正确地处理日期和时间。首先，我们来看大部分的程序都是这么创建当前时间并存入数据库的：Date date = new Date();store2db(date);这么做的问题在于，数据库的DateTim

2015-03-15 13:17:29 572

原创 java在不同系统中处理换行符

Linux,Unix和mac系统的换行是"\n"，而Windows的换行并不是直接的"\n"，是"\r\n"。所以out.write("\n")只能得到一个黑框，因为Windows不认为这是个“换行”。直接从记事本输入的话，Windows自动输入了"\r\n"，所以从从文本文件中读出来的也是"\r\n"，可以正常显示。那么这是为什么呢？稍微学过正则表达式的朋友都知道：\r是回车符，而\n

2015-03-15 10:57:34 3350

原创 Jericho Html paser详解

Jericho Html paser详解Jericho Html parseAPI: http://jericho.htmlparser.net/docs/javadoc/index.html 1：Source在解析Html文档中第一步就是创建一个Source对象，该对象的构造方法如下：Source(java.lang.CharSequence text)

2014-06-13 20:55:23 2181

原创 jericho-html解析html的一个例子

public static void main(String[] args) throws ClientProtocolException, IOException { CloseableHttpClient client = HttpClients.createDefault(); HttpGet get = new HttpGet("http://book.douban.com/lat

2014-06-13 11:11:03 1348

原创 java字符编码

java出现乱码的原因是编码和解码所使用的

2014-05-27 20:43:20 627

转载 java中的io系统详解

Java 流在处理上分为字符流和字节流。字符流处理的单元为 2 个字节的 Unicode 字符，分别操作字符、字符数组或字符串，而字节流处理单元为 1 个字节，操作字节和字节数组。Java 内用 Unicode 编码存储字符，字符流处理类负责将外部的其他编码的字符流和 java 内 Unicode 字符流之间的转换。而类 InputStreamReader 和 OutputStreamWr

2014-05-21 21:49:59 466

原创 Description Resource Path Location Type Access restriction: The constructor LoadLibraryAction(String

在做压缩借Description Resource Path Location Type Access restriction: The constructor LoadLibraryAction(String) is not accessible due to restriction on required library C:\Program Files\Java\jre6\lib\rt.

2014-05-16 11:58:28 9021

原创 Tomcat体系结构与运行流程

Server(服务器)是Tomcat构成的顶级构成元素，所有一切均包含在Server中，Server的实现类StandardServer可以包含一个到多个Services;次顶级元素Service的实现类为StandardService调用了容器(Container)接口，其实是调用了Servlet Engine(引擎)，而且StandardService类中也指明了该Service归属的Se

2014-05-09 13:09:11 642

原创 web服务器原理初探

web服务器接收并解析浏览器发送过来的http请求

2014-05-08 20:33:14 497

原创 jakarta pool demo

package com.cdw.pool;import org.apache.commons.pool2.BasePooledObjectFactory;import org.apache.commons.pool2.PooledObject;import org.apache.commons.pool2.impl.DefaultPooledObject;public class St

2014-04-21 11:13:07 1121

import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException;import java.util.List;import java.util.Map;import org.apache.commons.dbutils.DbUtils;import org.apache.commons.dbu

2014-04-17 16:51:27 726

原创 Jakarta BeanUtils使用例子程序

//必须要加beanutils包和logging包public class BeanUtilsDemo { public static void main(String[] args) throws IllegalAccessException, InvocationTargetException, NoSuchMethodException{ Company c = new Compa

2014-04-17 14:04:47 640

原创 java图片添加文字

//1.将图片读取到内存中BufferedImage img = ImageIO.read(new File("2.jpg"));//2.获取图片的画布Graphics g = img.getGraphics();//3.在画布的指定位置上画文字g.setColor(Color.RED);g.setFont(new Font("微软雅黑",Font.BOLD,25));

2014-04-13 18:55:34 1922

转载 Linux dig命令

linux下使用dig命令来查询域名信息,当然也可以使用nslookup，但dig比nslookup更方便更强大一些。 dig 基本的用法:1. 查找一个域名的授权 dns 服务器 dig xxx.com. +nssearch 2. 从根服务器开始追踪一个域名的解析过程　 dig xxx.com. +trace 3. 查询权威dn

2014-03-24 20:02:39 700

转载协同过滤算法的问题及解决方案

文章转载:http://blog.youkuaiyun.com/cserchen/article/details/58383331 协同过滤在应用中存在的问题尽管协同过滤在电子商务推荐系统中的应用获得了较大的成功，但随着站点结构、内容复杂度和用户人数的不断增加，基于协同过滤的推荐系统的发展面临着两个主要挑战： 1) 提高协同过滤算法的可扩展性协同过滤算法能够容易地

2013-12-30 13:10:30 6297

转载个性化智能推荐技术研究总结

文章转载自：http://blog.youkuaiyun.com/zolalad/article/details/16344183个性化智能推荐技术研究总结随着网络与信息技术的飞速发展，互联网为用户提供越来越多的信息和服务，用户在得到便利的同时也不得不面临大量的垃圾信息和无意义数据，即所谓的信息超载问题。面对海量的网络资源，个性化推荐系统是一种极具潜力的解决信息超载的服务技术，它利

2013-12-30 12:42:58 3119

原创 java连接数据库的一个问题

用java连接远程数据连不上，报端口问题。解决方法如下：1：用netstat -ano 查看1433端口是否打开。2：用telnet 192.168.44.168 1433查看对方端口是否可以连通3：如果不能连通，则关闭防火墙

2013-10-29 20:04:31 491

转载 Hadoop上控制Map的数量

很多文档中描述，Mapper的数量在默认情况下不可直接控制干预，因为Mapper的数量由输入的大小和个数决定。在默认情况下，最终input占据了多少block，就应该启动多少个Mapper。如果输入的文件数量巨大，但是每个文件的size都小于HDFS的blockSize，那么会造成启动的Mapper等于文件的数量（即每个文件都占据了一个block），那么很可能造成启动的Mapper数量超出限制而导

2013-10-16 08:45:19 401

原创 Canopy算法原理

Canopy聚类算法是一个将对象分组到类的简单、快速、精确地方法。每个对象用多维特征空间里的一个点来表示。这个算法使用一个快速近似距离度量和两个距离阈值 T1>T2来处理。基本的算法是：从一个点集合开始并且随机删除一个，创建一个包含这个点的Canopy，并在剩余的点集合上迭代。对于每个点，如果它与这个Canopy的距离小于T1，那么就将这个点就加入这个Canopy中。除此之外，如果这个距离

2013-09-17 10:53:56 1309

原创 Mahout文本聚类实例

1：下载路透社数据数据集下载地址：http://www.daviddlewis.com/resources/testcollections/reuters21578/2：提取文本内容下载的文件数据格式是SGML格式，这种格式和XML格式很类似。我们需要将这种格式的数据转化为SequenceFile格式，首先就要提取出txt格式。使用的是Mahout中自带的工具类：org.ap

2013-08-02 19:58:31 3632 1

转载 Aho-Corasick算法

1、概述Aho-Corasick自动机算法（简称AC自动机）1975年产生于贝尔实验室。该算法应用有限自动机巧妙地将字符比较转化为了状态转移。此算法有两个特点，一个是扫描文本时完全不需要回溯，另一个是时间复杂度为O(n)，时间复杂度与关键字的数目和长度无关。好了，我们先看下最原始的多模式匹配算法：主串T，n=strlen（T）。模式串Pi mi = strlen

2013-07-27 15:59:02 937

转载 java实现简单的缓存机制

CacheMgr.javaimport java.util.*;import cn.javass.framework.cache.vo.CacheConfModel;public class CacheMgr {private static Map cacheMap = new HashMap();private static Map cacheConfMap = new

2013-07-11 09:39:09 646

转载 Java数据缓存实现的核心机制

在大数据量访问读取中，数据缓存是最普遍采用的解决方案之一，但在读过很多代码的缓存实现，代码可圈可点的弹性都很大,在一并发数不多时，功能是完全没有问题的，但是对大数量的多并发操作上就有些差强人意了。以下为集数家之长实现的数据缓存核心机制代码片段,以抛砖引玉，供大家学习，此片段的核心代码参考sun的源码实现。sun没有对此段代码开放，它的功能在ArrayBlockingQueue(jdk1.5)中

2013-07-11 09:36:43 683

转载 jvm配置

堆大小设置JVM中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。 32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在WindowsServer2003系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型JVM参数配置：java -Xmx3550m-Xms355

2013-07-11 09:35:01 615

原创 mahout测试naive Bayes算法

根据mahout in action中的14.6章节做的测试，记录如下：1：将20news-bydate-train和20news-bydata-test中的每个目录中的数据转换为以目录名称开始的包含所有单词的简单文本文件，使用的mahout命令如下：mahout prepare20newsgroups -p 20news-bydate-train/ -o 20news-train/

2013-06-19 10:37:47 1456

转载大数据与云计算

近几年来，云计算受到学术界和工业界的热捧，随后，大数据横空出世，更是炙手可热。那么，大数据和云计算之间是什么关系呢？从整体上看，大数据与云计算是相辅相成的大数据着眼于“数据”，关注实际业务，提供数据采集分析挖掘，看重的是信息积淀，即数据存储能力。云计算着眼于“计算”，关注 IT解决方案，提供 IT 基础架构，看重的是计算能力，即数据处理能力。没有大数据的信息积淀，则云计算的计算

2013-05-13 15:15:34 1234

转载 Mahout推荐算法基础

Mahout主要推荐算法 Mahout推荐算法分为以下几大类GenericUserBasedRecommender 算法：1.基于用户的相似度2.相近的用户定义与数量特点：1.易于理解2.用户数较少时计算速度快 GenericItemBasedRecommender 算法：1.基于item的相似度特点：1.item较少时就算速度更快2

2013-04-01 18:49:56 982

转载 mahout 安装

软件准备：hadoop-0.20.2,mahout-0.4,ubuntu 11.10,jdk1.6 mahout的版本0.4只对hadoop-0.20.2版本兼容如果fs版本为hadoop0.20.2 请下载mahout0.4版本 mahout是hadoop的一种高级应用。运行mahout需要提前安装好hadoop。hadoop的安装网上很多。而且也不复杂，这里不再讲述。这里默认had

2013-03-09 16:27:39 576

转载 sed学习

1. Sed简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾。文件内容并没有改变，除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件；简化对文件的反复操作；编写转换程序等。以

2013-03-04 15:58:24 304

转载 awk学习

一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到最后一行，寻找匹配的特定模

2013-03-04 14:50:16 280

转载 awk小结

awk 用法：awk ' pattern {action} ' 变量名含义 ARGC 命令行变元个数 ARGV 命令行变元数组 FILENAME 当前输入文件名 FNR 当前文件中的记录号 FS 输入域分隔符，默认为一个空格 RS 输入记录分隔符 NF 当前记录里域个数 NR 到目前为止记录数 OFS 输出域分隔符 ORS 输出记录分隔符

2013-03-04 14:46:42 328

转载 hadoop heartbeat分析

1. Data node -> name node heart beatdatanode 发起heart beat，周期性的向name node发送。heart beat间隔通过 dfs.heartbeat.interval 进行设置。在data node中的主循环 offerService（）发起heart beat：主要包含以下信息： DatanodeCommand[] cm

2013-02-28 16:40:16 1584

转载 Hbase安装配置

文章来源：http://blog.youkuaiyun.com/hguisu/article/details/7244413hbase安装配置（整合到hadoop） Huangguisu1.快速单机安装：在单机安装Hbase的方法。会引导你通过shell创建一个表，插入一行，然后删除它，最后停止Hbase。只要10分钟就可以完成以下的操作。1.1下载解压最新版本选择一个 Apache 下

2012-12-17 21:09:02 813

转载大型互联网站解决海量数据的常见策略

文章来源：http://www.javabloger.com/article/big-data-architecture.html 大型互联网站的数据存储与传统存储环境相比不仅是一个服务器、一个数据库那么简单，而是由网络设备、存储设备、应用服务器、公用访问接口、应用程序等多个部分组成的复杂系统。分为业务数据层、计算层、数据仓储、数据备份，通过应用服务器软件提供数据存储服务，并且通过监控

2012-12-17 18:25:49 342