自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 数据分析(1)描述分析

一、基本统计分析1、样本均值:2、样本中位数:3、样本分位数4、样本众数5、样本极差6、样本方差:SUM((样本值-样本均值)^2 )/n-17、样本标准差:POWER(样本方差,2)8、频数:样本值出现次数9、峰度:大于0比标准正太陡,小于0比正太分布平缓10、偏度:大于0峰值靠右侧,小于0峰值靠左侧11、Z分位:样本值与样本均值相差多少个标准差(标准差倍数)12、T分位:Z分位的线性变换(为了数据更好看一些)二、探索分析1、正态性检验:样本是否符合正太分布2、卡方检验:交叉

2020-09-09 22:55:06 685

原创 大数据项目实践--手机日志分析

一、准备win10开发环境1、下载jdk-8u45-windows-x64.exe 安装于D:\Java82、修改JAVA_HOME为D:\Java8\jdk1.8.0_453、修改HADOOP_HOME为D:\hadoop2724、复制hadoop 2.7.x 的 winutils等文件到D:\hadoop272\bin,否则eclipse无法进行调试5、复制hadoop-eclipse-plugin-2.7.2至D:\eclipsehadoop272\plugins二、搭建cent

2020-08-17 14:18:22 1465

原创 Spark Core&Sql Scala&Java实验

1、Eclipse安装Scala插件help->install new software addscala-idehttp://download.scala-ide.org/sdk/lithium/e44/scala211/stable/site选择安装scala ide for eclipse重启eclipse2、

2020-08-01 22:07:59 313

原创 scala spark kafka 集群部署 及简单实验

1、上传scala-2.10.4.tgz 至 /usr 并解压tar -zvxf scala-2.10.4.tgz2、编辑/etc/profileexport SCALA_HOME=/usr/scala-2.10.4export PATH=$PATH:${SCALA_HOME}/bin更新系统设置source /etc/profile3、测试[root@lining05 usr]# scalaWelcome to Scala version 2.10.4 (Java HotSpot(

2020-07-25 20:56:11 356

原创 flume实验

1、上传flume-ng-1.5.0-cdh5.3.6.tar.gz 至/opt/modules/cdh/ 并解压2、编辑 /conf/flume-env.shexport JAVA_HOME=/usr/java/jdk1.7.0_793、编辑/etc/profileexport FLUME_HOME=/opt/modules/cdh/apache-flume-1.5.0-cdh5.3.6-binexport PATH=$PATH:$FLUME_HOME/bin4、flume业务情景fl

2020-07-24 16:05:47 869

原创 Hbase JAVA 项目实验

1、本项目使用MAVEN部署因此先部署本地MAVEN仓库,下载apache-maven-3.6.3 至D:\apache-maven-3.6.3,配置环境变量 MAVEN_HOME=D:\apache-maven-3.6.3 PATH=%MAVEN_HOME%\bin2、修改D:\apache-maven-3.6.3\conf\settings.xml修改本地仓库地址 <localRepository>D:/apache-maven-3.6.3/repository

2020-07-22 21:23:29 244 1

原创 Sqoop 实验

1、使用windows客户端登录mysql建表修改虚拟机mysql的远程登录权限mysql -uroot -proot;use mysql;show tables;update user set host='%' where host = 'localhost';flush pricilges;给本地ip 192.168.198.1及lining05授权GRANT ALL PRIVILEGES ON *.* TO 'root'@'192.168.198.1' IDENTIFIED BY

2020-07-15 19:40:33 450

原创 CDH5.3.6在centos6.5上集群安装(2)

29、将zookeeper-3.4.5-cdh5.3.6.tar.gz 上传至/opt/modules/cdh cd /opt/modules/cdh tar -zxvf zookeeper-3.4.5-cdh5.3.6.tar.gz cd /opt/modules/cdh/zookeeper-3.4.5-cdh5.3.6 mkdir data cd /opt/modules/cdh/zookeeper-3.4.5-cdh5.3

2020-07-14 16:39:39 156

原创 CDH5.3.6在centos6.5上集群安装(1)

1、/etc/selinux/config -> SELINUX=disabled/etc/hosts -> 192.168.198.131 lining05/etc/sysconfig -> HOSTNAME=lining05/etc/sysconfig/network-scripts/ifcfg-eth0 -> DEVICE="eth0" BOOTPROTO="static" NM_CONTROLLED="yes" ONBOOT="yes" TYPE

2020-07-05 13:33:57 185

原创 hive 操作笔记

1、CDH HIVE 5.3.6 配置1.1 下载 CDH 组件环境http://archive.cloudera.com/cdh5/cdh/5/jdk-7u79-linux-x64.tar.gzhttp://archive.cloudera.com/cdh5/cdh/5/hadoop-2.5.0-cdh5.3.6.tar.gzhttp://archive.cloudera.com/cdh5/cdh/5/hive-0.13.1-cdh5.3.6.tar.gzhttp://archive.cloud

2020-07-04 21:21:54 195

原创 Hdfs 初学实验笔记

Hdfs 实验Hdfs 实验1、windows 单机 安装hadoop2722、linux虚拟机 三台安装 hadoop 2.7.23、JAVA操作WINDOWS上的HDFS4、JAVA操作Linux上的HDFS5、MapReduce WordCount 项目6、MapReduce PhoneFlow 项目Hdfs 实验本篇文章为Hdfs基础实验整体流程,中间如有不详处,或因环境所致踩坑,请自行baidu解决1、windows 单机 安装hadoop272(hadoop3.2暂时没有windows环

2020-05-22 10:36:17 465

原创 MySql数据库更新表的物理排序

表中数据原本是按插入顺序排列的,如想按照特定列重排表中数据,使用alter table ‘tablename’ order by `field1` , `field2`;

2020-05-15 11:20:36 714

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除