- 博客(112)
- 资源 (6)
- 问答 (3)
- 收藏
- 关注
转载 /etc/profile、/etc/bashrc、~/.bash_profile、~/.bashrc
原文地址:/etc/profile、/etc/bashrc、~/.bash_profile、~/.bashrc 作者:gavinZLX/etc/profile:此文件为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行并从/etc/profile.d目录的配置文件中搜集shell的设置. /etc/bashrc:为每一个运行bash shell的用户执行此
2015-05-03 16:20:13
652
转载 跳跃表-原理及Java实现
跳跃表的引入我们知道,普通单链表查询一个元素的时间复杂度为O(n),即使该单链表是有序的,我们也不能通过2分的方式缩减时间复杂度。 如上图,我们要查询元素为55的结点,必须从头结点,循环遍历到最后一个节点,不算-INF(负无穷)一共查询8次。那么用什么办法能够用更少的次数访问55呢?最直观的,当然是新开辟一条捷径去访问55。
2014-06-15 10:02:13
1341
转载 各类数据结构的特点
数据结构是对在计算机内存中(有时在磁盘中)的数据的一种安排。数据结构包括数组、链表、栈、二叉树、哈希表等等。算法对这些结构中的数据进行各种处理。例如,查找一条特殊的数据项或对数据进行排序。掌握这些知识以后可以解决哪些问题呢?现实世界数据存储程序员的工具建模数据结构的特性:数组:优点是插入快,如果知道下标,可以非常快地存取。缺点是查找慢,删除慢,大小固
2014-06-10 20:39:02
2610
转载 Treap(树堆)
Treap=Tree+Heap。Treap本身是一棵二叉搜索树,它的左子树和右子树也分别是一个Treap,和一般的二叉搜索树不同的是,Treap记录一个额外的数据,就是优先级。Treap在以关键码构成二叉搜索树的同时,还按优先级来满足堆的性质(在这里我们假设节点的优先级大于该节点的孩子的优先级)。但是这里要注意的是Treap和二叉堆有一点不同,就是二叉堆必须是完全二叉树,而Treap可以并不一定是
2014-06-08 09:54:55
669
转载 红黑树
红黑树是一种经典的数据结构,在linux内存管理、nginx 等很多地方用到它。主要操作包括插入、删除,其中插入6种情况,删除8种情况,详细的思路就不说了,如果不太明白的请参考算法导论13章,看的时候一定要把每一种插入、删除的情况在纸上自己画出来,这样会节省你很多时间。下面是java实现的代码:[java] view plaincopy
2014-06-08 08:49:45
598
转载 二叉树
为什么使用树: 树结合了两种数据结构的有点:一种是有序数组,树在查找数据项的速度和在有序数组中查找一样快;另一种是链表,树在插入数据和删除数据项的速度和链表一样。既然这样,我就要好好去学了....(最主要讨论的是二叉树中的二叉搜索树,即一个节点的左子节点关键值小于这个节点,右子节点的关键值大于这个节点) 设计前的思考:树——>元素(节点)
2014-06-04 21:21:08
693
原创 算法导论-栈和队列的简单实现
栈:接口:public interface Stack {boolean isEmpty();void clear();T pop();boolean push(T t);int length();// 查看站顶元素,不执行移除T peek();// 返回对象位置int search(T t);}
2014-06-02 15:36:54
764
转载 dba_dependencies
当一个object A 定义中引用了object B, 则说明object A依赖于object B。比如,创建视图employees是通过查询子句查询表emp而来的,那么employees就依赖于emp。employees引用了emp表中的所有列,当修改emp表中的列时,会导致视图employees失效:("Compiled with errors", "Invalid", "
2014-04-14 21:21:47
1528
转载 快速排序及优化
http://www.blogjava.net/killme2008/archive/2010/09/08/quicksort_optimized.htmlupdate:更正选择中数的描述,在7到39之间的数组大小选择median-of-three来选择pivot,大小等于7的数组则直接使用中数作为pivot。 quicksort可以说是应用最广泛的排序算法之一,它的基本思想是分
2014-04-09 22:01:31
594
转载 算法导论_最大子数组问题(分治策略)
package com.wzs;import java.util.Arrays;/** * 算法导论--page41 * * @author Administrator * */public class FindMaximumSubArray {public static void main(String[] args) {int
2014-04-06 19:06:04
496
转载 Product_user_profile表
Product_user_profile是system模式下的一个表,在此表中存在的数据可以让客户端程序登入的时候检查是否在命令的执行上有什么限制。修改了product_user_profile内容,用户必须重新登录sql*plus,修改才会生效,也就是只有在登录的时候,sql*plus才会检查一遍product_user_profile表中内容。SQL*Plus: CO
2014-03-30 09:43:23
1209
转载 oracle查询约束
我们可以使用下面语句从all_constraints视图中查看某表上的约束: SELECT constraint_name, table_name, r_owner, r_constraint_name FROM all_constraints WHERE table_name = 'table_name' and owner = 'owner_name';
2014-03-29 23:25:53
947
转载 dbms_metadata.get_ddl
--GET_DDL: Return the metadata for a single object as DDL.-- This interface is meant for casual browsing (e.g., from SQLPlus)-- vs. the programmatic OPEN / FETCH / CLOSE interfaces above.-
2014-03-29 20:34:37
526
转载 ORACLE 函数ORA_ROWSCN
今天看到一个新函数ora_rowscn(其实这个函数也不新了,从oracle10g R1 就有了,只是我不知道,嘿嘿。。。),顺道在这里记录下。 ORA_ROWSCN是建立在oracle系统时钟(SCN)基础上,在表级应用的函数。下例所示,在查询语句里直接调用ora_rowscn,就就能显示出每行最后一次的SCN,Example1:bu5705@ADW1U>sele
2014-03-27 20:52:09
1517
转载 insert /*+ APPEND */
总结得出以下3点结论:a、非归档模式下,只需append就能大量减少redo的产生;归档模式下,只有append+nologging才能大量减少redo。b、insert /*+ append */ 时会对表加锁(排它锁),会阻塞表上的除了select以外所有DML语句;传统的DML在TM enqueue上使用模式3(row exclusive),其允许其他DML在相同的模式上获得TM e
2014-03-27 20:48:47
859
转载 Oracle视图user_tab_modifications
user_tab_modifications收集自采集信息以来被改变表的dml操作量数据,一个表只有数据量被改变10%以上才会被定期采集信息,也可以执行过程DBMS_STATS.FLUSH_DATABASE_MONITORING_INFO进行实时采集。由于user_tab_modifications收集的信息是自第一次收集以来的信息,所以要了解某一段时间对某表的dml操作情况,应该
2014-03-27 20:35:28
1873
转载 oracle:INSERT ALL和INSERT FIRST
关于INSERT ALL和INSERT FIRST 一、无条件 INSERT ALL 二、条件 INSERT ALL 三、条件 INSERT FIRST Insert…Select 使用Insert Select实现同时向多个表插入记录 一、无条件 INSERT ALL ------------------------------------------------
2014-03-26 22:21:48
547
转载 Oracle中merge into的使用
http://blog.youkuaiyun.com/yuzhic/article/details/1896878http://blog.youkuaiyun.com/macle2010/article/details/5980965该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中,使用此命令必须同时指定UPDATE 和INSERT 关键词,ORACLE
2014-03-26 22:21:04
549
转载 (转)oracle索引语句整理
1.创建索引 create [unique]index index_name on table_name(col_1,col_2,...) tablespace tabspace_name; 2.改变索引的存储参数 alter index index_name pctfree 30 storage(initial 200k next 200k);
2014-03-20 21:15:31
871
转载 云计算(三十三)-Hbase使用filter快速高效查询
几大Filters1、Comparision Filters 1.1 RowFilter1.2 FamilyFilter 1.3 QualifierFilter 1.4 ValueFilter 1.5 DependentColumnFilter2、Dedicated Filters 2.1 SingleColumnValue
2014-02-22 16:30:42
1108
转载 云计算(三十二)-HBase MapReduce实例分析
引言跟Hadoop的无缝集成使得使用MapReduce对HBase的数据进行分布式计算非常方便,本文将以前面的blog示例,介绍HBase下MapReduce开发要点。很好理解本文前提是你对Hadoop MapReduce有一定的了解,如果你是初次接触Hadoop MapReduce编程,可以参考http://qa.taobao.com/?p=10523 这篇文章来建立基本概念。HBase
2014-02-22 16:23:49
1051
转载 云计算(三十一)-hbase Java API
引言HBase提供了Java Api的访问接口,掌握这个就跟Java应用使用RDBMS时需要JDBC一样重要,本文将继续前两篇文章中blog表的示例,介绍常用的Api。练习前的准备工作创建一个Maven工程,加入以下依赖:org.apache.hbasehbase0.90.2如果你的Maven库里还没有hbase,还需要配置下repository
2014-02-22 16:09:58
1072
转载 云计算(三十)-hbase shell基础和常用命令详解
HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。 1. 简介 HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable:一个结构化数据的分布式存储系统》。HBase是Google Bigtabl
2014-02-22 15:53:38
696
转载 常用Maven插件介绍
我们都知道Maven本质上是一个插件框架,它的核心并不执行任何具体的构建任务,所有这些任务都交给插件来完成,例如编译源代码是由maven- compiler-plugin完成的。进一步说,每个任务对应了一个插件目标(goal),每个插件会有一个或者多个目标,例如maven- compiler-plugin的compile目标用来编译位于src/main/java/目录下的主源码,testCompi
2014-02-22 14:48:45
588
转载 【Maven】Maven Plugin示例:自己动手编写Maven插件
需求:在Maven编译项目的时候,统计代码量,即项目中的文件数目、代码行数,包括java文件和配置文件两种;其中配置文件(sql、xml、properties)代码行数/4 处理。创建项目:首先确保已安装m2eclipse插件:http://eclipse.org/m2e/eclipse - new - Maven Project,选择archetype
2014-02-22 14:41:33
986
转载 MAVEN常用命令
Maven库:http://repo2.maven.org/maven2/Maven依赖查询:http://mvnrepository.com/Maven常用命令: 1. 创建Maven的普通java项目: mvn archetype:create -DgroupId=packageName -DartifactId=project
2014-02-22 14:31:24
559
转载 Maven生命周期详解
转载自:http://juvenshun.iteye.com/blog/213959Maven强大的一个重要的原因是它有一个十分完善的生命周期模型(lifecycle),这个生命周期可以从两方面来理解,第一,顾名思义,运行Maven的每个步骤都由它来定义的,这种预定义的默认行为使得我们使用Maven变得简单,相比而言,Ant的每个步骤都要你手工去定义。第二,这个模型是一种标准,在不同的
2014-02-22 14:30:22
500
转载 maven Nexus入门指南(图文)
转载自http://aijezdm915.iteye.com/blog/1335025Nexus介绍Nexus 是Maven仓库管理器,如果你使用Maven,你可以从Maven中央仓库 下载所需要的构件(artifact),但这通常不是一个好的做法,你应该在本地架设一个Maven仓库服务器,在代理远程仓库的同时维护本地仓库,以节省带宽和时间,Nexus就可以满足这样的需要。
2014-02-22 14:28:06
606
转载 云计算(二十九)- HBase简介
一、 简介historystarted by chad walters and jim2006.11 G release paper on BigTable2007.2 inital HBase prototype created as Hadoop contrib2007.10 First useable Hbase2008.1 Hadoop
2014-02-08 20:47:32
643
转载 云计算(二十八)-【HBase】Rowkey设计
本章将深入介绍由HBase的存储架构在设计上带来的影响。如何设计表、row key、column等等,尽可能地使用到HBase存储上的优势。Key设计HBase有两个基础的主键结构:row key和column key。它们分别用来表征存储的数据和数据的排序顺序。以下的几节将讨论如何通过key设计解决存储设计中发现的一些问题。概念相比于物理存储,首先谈谈表的逻辑结构
2014-02-08 17:19:13
1277
原创 云计算(二十七)- 安装Zookeeper和hbase
安装zookeepervi /etc/security/limits.conf hadoop - nofile 32768 hadoop soft/hard nproc 32000 vi /etc/pam.d/login session required pam_limits.so 上传文件 tar xfz zookeeper-3.4.5.tar.gz
2014-01-18 16:23:23
843
转载 云计算(二十六)- 分布式服务框架 Zookeeper -- 管理分布式环境中的数据
安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础,最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取,Zookeeper 的安装非常简单,下面将从单机模式和集群模式两个方面介绍 Zookeeper 的安装和配置。单机模式单机安装非常简单,只要获取到 Zookeeper 的压缩包并解压到某
2014-01-14 21:42:09
843
翻译 云计算(二十五)- Hadoop MapReduce Next Generation - Writing YARN Applications
概念和流程The general concept is that an 'Application Submission Client' submits an 'Application' to the YARN Resource Manager. The client communicates with the ResourceManager using the 'Applica
2014-01-01 16:24:48
1647
原创 云计算(二十四)- Apache Hadoop NextGen MapReduce (YARN)
前面学习了第一代的MR,今天开始学习一下YARN,MR部分的源码会在以后的源码分析中介绍,相关的优化也会在其中实现,该分析应该会在学习完大部分hadoop生态圈后进行深入的学习。下面开始正题:MapReduce在hadoop-0.23中已经进行了升级,这个升级被我们成为MapReduce 2.0 (MRv2)或者是YARN。MRv2的基本思路就是将MapReduce h
2013-12-28 19:27:32
998
原创 云计算(二十三)-编写WordCount并使用MRUnit测试
1 建立一个java项目,将hadoop依赖的包导入项目中2 创建Mapper类public class MapperClass extends Mapper{IntWritable one = new IntWritable(1);Text word = new Text();protected void map(Object key, Text value,org.apac
2013-12-24 22:31:41
1526
原创 Hadoop的一些资源
博客:http://www.taobaotest.com/users/qa/blogs?uid=222http://dongxicheng.org/recommend/http://www.cloudera.com/content/cloudera/en/why-cloudera/hadoop-and-big-data.html
2013-12-22 18:19:58
1029
转载 云计算(二十二)- 分析MapReduce执行过程
MapReduce运行的时候,会通过Mapper运行的任务读取HDFS中的数据文件,然后调用自己的方法,处理数据,最后输出。Reducer任务会接收Mapper任务输出的数据,作为自己的输入数据,调用自己的方法,最后输出到HDFS的文件中。整个流程如图5-6所示。图5-6Mapper任务的执行过程每个Mapper任务是一个java进程,它会读取HDFS中的文件,解析
2013-12-22 10:45:28
977
转载 云计算(二十一)- HDFS API详解
Hadoop中关于文件操作类基本上全部是在"org.apache.hadoop.fs"包中,这些API能够支持的操作包含:打开文件,读写文件,删除文件等。Hadoop类库中最终面向用户提供的接口类是FileSystem,该类是个抽象类,只能通过来类的get方法得到具体类。get方法存在几个重载版本,常用的是这个: static FileSystem get(Config
2013-12-21 17:13:37
827
转载 云计算(二十)-Hadoop Streaming
Hadoop StreamingHadoop StreamingHadoop streaming是Hadoop的一个工具, 它帮助用户创建和运行一类特殊的map/reduce作业, 这些特殊的map/reduce作业是由一些可执行文件或脚本文件充当mapper或者reducer。例如:$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/h
2013-12-17 20:58:10
1062
转载 云计算(十九)- Hadoop Map/Reduce教程
Hadoop Map/Reduce教程目的先决条件概述输入与输出例子:WordCount v1.0源代码用法解释Map/Reduce - 用户界面核心功能描述MapperReducerPartitionerReporterOutputCollector作业配置任务的执行和环境作业的提交与监控作业的控制作业的输入InputSpl
2013-12-16 22:19:11
1560
TA创建的收藏夹 TA关注的收藏夹
TA关注的人