美梦是个可怜虫-优快云博客

原创给刚学spark的你，一些建议~！

前述：这几天看完了一本有关spark的书，加上回顾了一些spark的视频，感觉以前很多不是很懂的细节，现在终于有了一点概念。在这里安利一些入门spark的资源：网易云课堂，林子雨老师的spark视频，讲的很细节，很适合入门边学边做。《spark最佳实践》：里面涉及到很多基础的知识点，所以入门也应该看看，并且对spark编程方面也会有所帮助。《Spark大数据处理：技术、应用与性能优化》...

2018-11-29 17:36:53 703

原创 spark集群搭建与mysql元数据管理

找个spark集群搭建是针对于上一篇hadoop的基础上搭建的。所以spark的版本也是要按照着hadoop版本进行下载。1.解压spark，修改spark的/etc/profile的home目录。2.安装SCALA，并配置SCALA_HOME。3.修改spark conf目录下的spark-env.sh文件，并添加下列配置 export JAVA_HOME=/roo...

2018-08-27 15:23:24 1222

原创 hadoop分布式集群搭建

集群搭建（以搭建三个节点为例子）1.打开centos网卡NAT模式2.查看各个主机的时间是不是同步：date命令2.修改/etc/sysconfig/network文件，设置主机名（centos2，centos03类似） # Created by anaconda NETWORKING=yes HOSTNAME=centos013.修改/etc/hosts文件（c...

2018-08-21 17:51:30 322

原创 github学习

有一个仓库，叫Repo A。你如果要往里贡献代码，首先要Fork这个Repo，于是在你的Github账号下有了一个Repo A2,。然后你在这个A2下工作，Commit，push等。然后你希望原始仓库Repo A合并你的工作，你可以在Github上发起一个Pull Request，意思是请求Repo A的所有者从你的A2合并分支。如果被审核通过并正式合并，这样你就为项目A做贡献了...

2018-07-05 11:27:14 188

原创利用jenkins运行我的第一个java程序

1.创建github和本地git仓库的关联关系首先创建在github上面创建一个repository，我们命名为algorithm。然后我们配置本地主机的git。在git shell中ssh，其中生产rsa公钥的时候，记得写自己gith注册的邮箱。然后生成了rsa.pub打开，把公钥字符上传到github上，这里的步骤网上有很多具体我不再详细描述。然后打开vscode，...

2018-06-21 20:11:27 2809 2

原创 PAT1009

package PAT1009;import java.util.Scanner;//相乘后1000的幂最多会变成2000，所以第二个数组需要声明为2000public class Main2 { public static void main(String[] args) { int k; int p; double q; ...

2018-04-02 16:32:33 253

原创 PAT1008

package PAT1008;import java.util.Scanner;public class Main { public static void main(String[] args) { int n; int preFloor, currFloor; int subtract; int sum; ...

2018-04-01 21:49:52 263

原创 PAT1007 C accept code

package PAT1007;import java.util.ArrayList;import java.util.Scanner;public class Main { public static void main(String[] args) { int k; ArrayList<Integer> al = new Array...

2018-03-31 23:09:48 197

原创 PAT1006

package PAT1006;import java.util.Scanner;public class Main { public static void main(String[] args) { int m; String id, sign, out; String inId = null, outId = null, min...

2018-03-30 18:42:22 270

原创 PAT1005

package PAT1005;import java.util.Scanner;public class Main { public static void main(String[] args) { String in; int sum; String result; Scanner sc = new Scanne...

2018-03-30 17:50:07 339

原创 PAT1004

package PAT1004;import java.util.Scanner;public class Main { public static void main(String[] args) { int[] tree = new int[101]; int[] deep = new int[101]; int n, m; ...

2018-03-30 17:17:39 177

原创 PAT1004差三分

package PAT1004;import java.util.Scanner;public class Main { public static void main(String[] args) { int[] tree = new int[101]; int[] deep = new int[101]; int n, m; ...

2018-03-30 15:26:54 152

原创 PAT1003

//代码没有100%通过package PAT1003;import java.util.Scanner;public class Main { static int[][] edges = new int[500][500]; static int[] vexs = new int[500]; static boolean[] visit = new bool...

2018-03-27 16:22:50 236

原创 PAT甲级1002

import java.util.HashMap;import java.util.Scanner;public class Main { public static void main(String[] args) { int K; Double sum; Integer exponents; Double coeff...

2018-03-25 10:41:10 166

原创 PAT甲级1001

import com.sun.org.apache.xpath.internal.SourceTree;import java.util.ArrayList;import java.util.Scanner;public class Main { public static void main(String[] args) { int a, b; ...

2018-03-22 23:44:47 323

hadoop集群1Created Friday 16 March 20181.单节点逐个启动.在主节点上运行:hadoop-daemon.sh start namenode在从节点上面启动:hadoop-daemon.sh start datanode在主节点上启动:yarn-daemon.sh start resourcemanager在从节点上启动:yarn-daemon.sh start n...

2018-03-16 20:51:43 259

原创 hdfs的一些基础

hdfsCreated Friday 16 March 2018hdfs:通过统一的命名空间目录树来定位文件.hdfs采用的是master/slave架构,一般一个hdfs集群是有一个namenode和一定数目的datanode组成,Namenode是hdfs集群主节点,datanode是hdfs集群的从节点,两种角色各司其职,共同协调完成分布式的文件存储服务.hdfs中的文件在物理上是分块存储(...

2018-03-16 20:50:06 351

原创 hadoop集群配置

配置hadoopCreated Thursday 15 March 2018一般在主节点进行修改配置后,利用scp命令下发给其他各个节点机器上已一个节点为例:比如我此次配置的node011.hadoop-env.shvi hadoop-env.shexport JAVA_HOME=/root/apps/jdk1.8.0_652.core-site.xml指定hadoop所使用的文件系统schema...

2018-03-15 23:07:31 151

原创 hadoop集群搭建前需要配置的一些内容

hadoop集群搭建前的配置Created Wednesday 14 March 2018系统是基于Centos64位的注意修改bootproto ，gateway， netmask网络环境准备：采用nat方式联网服务器系统设置：1.同步时间yum install ntpdatentpdate cn.pool.ntp.org2.设置主机名vi /etc/sysc...

2018-03-15 22:14:30 230

原创源码编译hadoop遇到的几个问题

自己搭建集群遇到的几个问题Created Thursday 15 March 2018源码编译hadoop的步骤在以下博客链接中:http://blog.youkuaiyun.com/libingxin/article/details/51097071编译hadoop需要的依赖可以查看BUILD.txt文件1.安装putty需要先安装GTK库2.在集群节点中，centos默认网卡的关闭的，需要vi /etc/...

2018-03-15 22:03:45 533

原创 hadoop的一些基础知识

HadoopCreated Wednesday 14 March 2018HDFS：分布式文件系统Yarn：作业调度和集群资源管理框架MapReduce：分布式运算编程框架狭义Hadoop定义：HDFS，YARN，MAPREDUCE广义Hadoop定义：一个hadoop生态圈 hadoop版本：社区版，商业版（cloudera的CDH）hadoop集群搭建：hadoop集群包含两个集群，HDFS集...

2018-03-14 21:31:31 231

原创大数据的一些介绍

数据分析Created Wednesday 14 March 2018 数据分析分为：描述性数据分析，探索性数据分析，验证性数据分析现状分析，原因分析，预测分析数据分析方法：是从微观的角度来说数据分析的方法数据分析方法论：从宏观上进行数据分析分布式服务框架：Dubbo（阿里巴巴）把服务层和应用层进行切割。提高并发量，减少资源消耗分布式静态资源：对网站的静态资源JS，CSS，图片等资源进行分布式部署...

2018-03-14 19:08:17 750

原创 ZooKeeper分布式协调服务-本质是一种小的分布式文件系统

ZooKeeperCreated Tuesday 13 March 2018ZooKeeper分布式协调服务ZooKeeper本质上是一个分布式的小文件系统1.全局数据一致性无论客户端链接到哪个server，展示的数据都是一致的，因为每个server保存一份相同的数据副本。2.可靠性如果消息被其中一台服务器接受，那么将被所有的服务器接受3.顺序性全局有序：一台服务器上消息a在消息b前发布，则在所...

2018-03-13 17:26:35 601

原创 shell的基础知识

shellCreated Tuesday 13 March 2018shell是用C语言编写的程序。bash由于易用免费，bash shell是linux系统默认的shellhello.sh但是后缀名并不影响脚本执行，但是后缀方便人识别这是个shell程序vi 创建一个hello.sh在文件种首行写上#!/bin/bash再写上echo "hello world"-rw-rw-r-- 1 pum...

2018-03-13 13:31:26 188

原创 linux基础知识和配置命令用法

Created Monday 12 March 2018ifconfig 查看系统ipping baidu.com完整克隆，需要修改主机名，网卡mac，和IP修改配置文件：vi /etc/sysconfig/network但是在ubuntu是修改 etc/hostnamerm -rf删除文件SSH：安全外壳协议，专为远程登录会话和其他网络服务提供安全性的协议，通过使用SSH，可以把传输的数据进行...

2018-03-12 23:07:31 441

原创 pom.xml配置文件

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4....

2018-03-08 19:18:19 212

原创 HDFS利用FileSystem API文件的读写

package com.demo.hadoop.hdfs;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataInputStream;import org.apache.hadoop.fs.FSDataOutputStream;import org.apache.hadoop.fs....

2018-03-06 15:20:18 1092

原创一个简单的WordCount程序

package com.demo.hadoop.mapreduce;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import o...

2018-03-04 19:22:11 403

Eclipse RCP开发详解

eclipse rcp开发插件详解，快速开发eclipse插件，资源很好

2018-08-04

mysql8的JDBC驱动

MySQL8.0.12的JDBC驱动，可以在需要用jdbc连接mysql的时候使用。

2018-08-04

Hadoop权威指南高清中文版第四版

大数据入门必读的书，介绍hadoop生态还有spark生态，想学习大数据必学的初级书。

2019-04-16

git快速使用手则

git使用手则，可以方便的查询git命令方便自己使用git。

2018-08-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

还记得那个追风少年吗

原创给刚学spark的你，一些建议~！

原创 spark集群搭建与mysql元数据管理

原创 hadoop分布式集群搭建

原创 github学习

原创利用jenkins运行我的第一个java程序

原创 PAT1009

原创 PAT1008

原创 PAT1007 C accept code

原创 PAT1006

原创 PAT1005

原创 PAT1004

原创 PAT1004差三分

原创 PAT1003

原创 PAT甲级1002

原创 PAT甲级1001

原创 hadoop集群开启

原创 hdfs的一些基础

原创 hadoop集群配置

原创 hadoop集群搭建前需要配置的一些内容

原创源码编译hadoop遇到的几个问题

原创 hadoop的一些基础知识

原创大数据的一些介绍

原创 ZooKeeper分布式协调服务-本质是一种小的分布式文件系统

原创 shell的基础知识

原创 linux基础知识和配置命令用法

原创 pom.xml配置文件

原创 HDFS利用FileSystem API文件的读写

原创一个简单的WordCount程序

Eclipse RCP开发详解

mysql8的JDBC驱动

Hadoop权威指南高清中文版第四版

git快速使用手则

空空如也