- 博客(17)
- 资源 (6)
- 收藏
- 关注
转载 mahout in action 2中文版(转) 推荐器介绍
mahout in action 2 推荐器介绍本章包括: 。介绍第一个Recommender 。推荐引擎的精确度评估 。评估一个引擎的准确度和召回 。在一个现实的例子Grouplens上评估一个Recommender 每天我们都形成对许多事情的看法,这些事情有我们喜欢的,不喜欢的,甚至不关心的。这是在不知不觉中发生的。当你在收音机上听到一首歌,你注意它,要
2014-05-04 18:11:01
586
转载 flume的原理和使用
概述 flume是cloudera公司的一款高性能、高可能的分布式日志收集系统。flume的核心是把数据从数据源收集过来,再送到目的地。为了保证输送一定成功,在送到目的地之前,会先缓存数据,待数据真正到达目的地后,删除自己缓存的数据。flume传输的数据的基本单位是event,如果是文本文件,通常是一行记录,这也是事务的基本单位。flume运行的核心是a
2014-05-04 14:05:30
503
转载 hbase 学习笔记一---基本概念
说在前面,本文部分内容来源于社区官网经过适度翻译,部分根据经验总结,部分是抄袭网络博文,(不一一列举引用,在此致歉)一并列在一起,本文的目的,希望能总结出一些有用的,应该注意到的东西,基本思路是先提出一个话题,在此话题内,把相关联的东西加进去,而不是单独分出章节单独介绍,虽然条理性欠差,但有利于后期根据关键词查找。 Apache HBase 是Hadoop database的简称,h
2014-05-04 10:55:38
395
转载 Hadoop学习笔记---MapReduce
1、认识MapReduce MapReduce 是一种可用于数据处理的编程模型,有一下特点: 编程模型简单,但业务实现不一定简单; Hadoop可以运行各种该语言编写的MapReduce程序,如java,python 等,很多企业为求开发效率采用python来开发MapReduce程序; MapReduce 程序是并行运行的,所以又叫批处理程序。
2014-05-04 10:51:02
315
转载 Hadoop学习笔记二---HDFS
HDFS的概念1、数据块 HDFS跟磁盘一样也有块的概念,磁盘上块的大小一般为512字节,而文件系统的块则一般是磁盘块的整数倍,比如我当前centos块的大小事4096 也就是4K,而HDFS块的大小由参数dfs.block.size 设定默认是64M,但是与单一磁盘文件系统相似,HDFS上的文件也被分为块大小的多个分块(chunk)。 为什么HDFS中的块
2014-05-04 10:49:04
361
转载 Hadoop学习笔记---基本概念
0、前言: 不做过多介绍Hadoop 网上比比皆是,每本书买来一看,第一张都是千篇一律,本文不做过多阐述,希望将此文建立在对hadoop有些了解的基础上,本文的总体流程是,先提出一个subject,然后根据关联将相关联的概念参数一并带出,虽整体不美观,但有助于将相关知识汇总记忆。1、Hadoop 版本图: 第一个大的主线是社区版的Hadoop路
2014-05-04 10:47:46
338
转载 Flume日志收集
一、Flume介绍Flume是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。设计目标:(1) 可靠性当节点出现故障时,日志能够被传送到其他节点上而不会丢失。Flume提供了三种级别的可靠性保障,从强到弱依次分别为:end-to-end(收到数
2014-05-04 10:44:13
373
转载 Tomcat里配置CRL
本文介绍在Tomcat中配置HTTPS双向认证(验证客户端)的情况下,如何验证CRL。 我们可以按照文章《如何用Tomcat和Openssl构建HTTPS双向认证环境(HTTPS客户端认证)》(http://blog.youkuaiyun.com/jasonhwang/archive/2008/04/29/2344768.aspx)里的方法在Tomcat里构建一个HTTPS验证客户端证书(Usbkey
2014-04-30 18:15:10
979
转载 如何用Tomcat和Openssl构建HTTPS双向认证环境(HTTPS客户端认证)
本文将介绍如何利用Tomcat的HTTPS功能,和一个自己创建的CA,来构建WEB服务器证书和个人数字证书,最终建成一个HTTPS双向认证环境(可以用于测试目的)。本文构建HTTPS双向认证的业务流程大致如下: 1. 创建WEB服务器公钥密钥,并生成服务器证书请求。 2. 利用自建的CA,根据服务器证书请求为服务器签发服务器证书。然后把服务器证书导回WEB服务器中。 3. 利用o
2014-04-30 17:48:49
377
转载 利用openssl创建一个简单的CA
本文旨在利用开源openssl软件,在Linux(或UNIX/Cygwin)下创建一个简单的CA。我们可以利用这个CA进行PKI、数字证书相关的测试。比如,在测试用Tomcat或Apache构建HTTPS双向认证时,我们可以利用自己建立的测试CA来为服务器端颁发服务器数字证书,为客户端(浏览器)生成文件形式的数字证书(可以同时利用openssl生成客户端私钥)。 该简单的CA将建立在用户
2014-04-30 17:32:37
551
转载 Linux下OpenSSL 安装图文详解
安装环境: 操作系统:CentOs6.3 OpenSSL Version:openssl-1.0.0e.tar.gz 目前版本最新的SSL地址为http://www.openssl.org/source/openssl-1.0.0e.tar.gz 1、将下载的压缩包放在根目录,2、在文件夹下解压缩,命令:tar -xzf
2014-04-30 17:30:57
647
原创 tomcat6优化
Tomcat的优化配置。 1、TomcatJVM初始化堆设定 -Xms【初始化内存大小】设定为1024m -Xmx【可以使用的最大内存】设定为1024m 具体设定如下: JAVA_OPTS=‘-server -Xms1024m -Xmx2048m -XX:PermSize=256M
2014-04-24 17:53:27
355
原创 spring自动注入和注解配置
1.spring配置文件 - Copyright 1999-2011 Alibaba Group. - - Licensed under the Apache License, Version 2.0 (the "License"); - you may not use this file except in compliance with the License.
2014-04-24 17:26:42
670
原创 pentaho使用步骤简介
一、通过pentaho对销售数据进行分析,生成销售报表,为公司的经营决策提供可靠的依据。 pentaho对销售数据分析步骤: 1、创建数据仓库表模型。 2、采用ETL工具kettle,数据库表的实时销售进行抽取,转换,插入到数据仓库。 3、采用pentaho公司的开源工具schema-workbench,为了对数据仓库中的数据进行多维分析,建立CUBE模型。 4
2014-04-24 16:50:43
1721
原创 Dubbo架构介绍
Dubbo架构随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进。Dubbo是流动计算架构(SOA)的实现。
2014-04-24 16:37:14
928
原创 j2ee学习
J2EE学习流程在这里我谈谈我在学习j2ee流程,并谈到在此过程中领会的经验和教训。以便后来者少走弯路。 Java发展到现在,按应用来分主要分为三大块:J2SE,J2ME和J2EE。这三块相互补充,应用范围不同。 J2SE就是Java2的标准版,主要用于桌面应用软件的编程; J2ME主要应用于嵌入是系统开发,如手机和PDA的编程; J2EE是Java2的企业版,主要用于分布式的
2006-05-17 15:45:00
948
AdvancED_ActionScript 3_CN中文版
2010-01-10
getting_started_with_Flex3.pdf
2009-12-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人