
大数据组件
文章平均质量分 88
pit_man
Dig value from big data in the Internet.
展开
-
windows系统下安装伪分布式Hadoop3.x
windows系统下安装伪分布式Hadoop3.0原创 2023-01-31 16:55:06 · 1455 阅读 · 0 评论 -
Linux离线安装MySQL5.7
1.下载安装包下载地址:https://cdn.mysql.com//Downloads/MySQL-5.7/mysql-5.7.27-1.el7.x86_64.rpm-bundle.tar上传到 /home 目录下2.解压安装包tar -xf mysql-5.7.27-1.el7.x86_64.rpm-bundle.tar -C /home/mysql/3.查询并卸载系统自带的Mariadbrpm -qa | grep mariadbrpm -e --nodeps 文件名4.查询并卸载系统原创 2021-12-10 10:31:05 · 1282 阅读 · 0 评论 -
CentOS7安装mysql
CentOS7安装mysql1.查看是否已安装2. 下载源4. 安装4.1 安装mysql4.2 修改密码策略4.3 修改密码4.4 设置远程访问4.5 配置默认编码为utf8官方安装教程:https://dev.mysql.com/doc/refman/5.7/en/linux-installation-yum-repo.html1.查看是否已安装rpm -qa | grep mysql如果已安装则删除 MySQL 及其依赖的包yum -y remove mysql-libs.x86_64原创 2021-10-06 22:30:04 · 256 阅读 · 0 评论 -
Kafka集群部署安装及使用
Kafka集群部署安装及使用一、安装部署1.1集群规划1.2 jar包下载1.3 部署1.4 Kafka命令行操作二、Kafka API的使用2.1 Producer API2.1.1 消息发送流程2.1.2 异步发送API2.2 Consumer API2.2.1 自动提交offset2.2.2 手动提交offset一、安装部署1.1集群规划hadoop100hadoop101hadoop102zookeeperzookeeperzookeeperkafkakafk原创 2021-10-05 11:47:38 · 4537 阅读 · 0 评论 -
flume概述、安装、入门案例
flume概述、安装、入门案例一、Flume概述1.1 Flume定义1.2 Flume基础架构1.2.1 Agent1.2.2 Source1.2.3 Sink1.2.4 Channel1.2.5 Event二、Flume入门2.1 Flume安装部署2.1.1 安装地址2.1.2 安装部署2.2 Flume入门案例2.2.1 监控端口数据官方案例2.2.2 实时监控单个追加文件2.2.3 实时监控目录下多个新文件2.2.4 实时监控目录下的多个追加文件一、Flume概述1.1 Flume定义Flu原创 2021-10-03 17:37:22 · 241 阅读 · 0 评论 -
Hbase概念、分布式集群部署和使用
一、概述HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统;HBASE只做查询和处理;数据量小的时候不适合用HBASE;HBASE写的时候非常慢,因为文件存在HDFS上;(读和写是一个此消彼长的过程,因为向快速的查,就必须建索引,写的时候就必须维护索引,就会变慢)HBASE的元数据表hbase:meta的位置存放在zookeeper上,HBASE从这个位置读取元数据,再根据元数据从HDFS读取数据;二、部署三、使用四大Nosql:图数据库:任务关系;文档数据库:键值对数原创 2021-08-02 22:52:02 · 522 阅读 · 0 评论 -
zookeeper的概念、集群部署、使用
一、概念分布式集群的协调者,选举出namenode,zk=文件系统+通知机制二、部署2.1 下载下载官网下载完成后把安装包上传到虚拟机hadoop100,上传方法请参考教程中的2.1 上传安装包2.2 安装安装的前提:确认关闭防火墙进入到安装目录:cd /usr/local/src解压:tar zxvf apache-zookeeper-3.5.5-bin.tar.gz修改名字: mv apache-zookeeper-3.5.5-bin zookeeper-3.5.5(这一步不是必要原创 2021-08-02 17:48:01 · 960 阅读 · 0 评论 -
Centos7部署全分布式Hadoop2.6
1.环境准备1.1克隆1.2修改ip、主机名2.配置Hadoop3.格式化并单点启动4.配置免密登陆,群启动5.运行Wordcount原创 2021-07-27 01:00:14 · 750 阅读 · 0 评论 -
Maven安装及配置IDEA
1.资源准备下载Maven:官网下载地址,点这里可下载旧版本下载IDEA:官网下载地址,专业版需要购买,可使用30天,也可下载社区版,网上也有很多破*解方法,自行查找。2.配置Maven2.1 解压maven,把maven-3.5.4放到D:\Program Files2.2 配置环境变量(1)新建->变量名"MAVEN_HOME",变量值"D:\Program Files\maven-3.5.4"(即maven的安装路径)(2)编辑->变量名"Path",在原变量值的最后面加原创 2021-07-27 21:54:58 · 310 阅读 · 0 评论 -
Windows环境Java JDK安装
1、安装JDK开发环境下载网站:http://www.oracle.com/开始安装JDK:修改安装目录如下:确定之后,单击“下一步”。注:当提示安装JRE时,可以选择不要安装。2、配置环境变量:对于Java程序开发而言,主要会使用JDK的两个命令:javac.exe、java.exe。路径:C:\Java\jdk 1.7.0 _09\bin。但是这些命令由于不属于windows自己的命令,所以要想使用,就需要进行路径配置。单击“计算机-属性-高级系统设置”,单击“环境变量”。在“原创 2021-07-27 10:32:31 · 2484 阅读 · 0 评论 -
centos7上部署单机模式和伪分布式模式Hadoop2.6
Hadoop集群的部署方式方式分为三种,分别是独立模式(Standalone mode)、伪分布式模式(Pseudo-Distributed mode)、完全分布式模式(Cluster mode),具体介绍如下。(1)独立模式:又称为单机模式,在该模式下,无需运行任何守护进程,所有的程序都在单个JVM上执行。独立模式下调试Hadoop集群的MapReduce程序非常方便,所以一般情况下,该模式在学习或者开发阶段调试使用。(2)伪分布式模式:Hadoop程序的守护进程运行在一台节点上,通常使用伪分布式模式原创 2021-07-26 23:46:17 · 490 阅读 · 2 评论 -
VMware安装centos7(用于分布式Hadoop集群部署)
VMware安装centos7(用于分布式Hadoop集群部署)1.安装VMware Workstation Pro 15下载安装2.安装Centos7下载功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入1.安装VMware Wo原创 2021-07-24 22:54:18 · 639 阅读 · 0 评论 -
解决vmware虚拟机安装时提示 Intel VT-x 处于禁用状态
当我们第一次安装虚拟机时会遇到这样的错误:Intel VT-x处于禁用状态。那么怎么解决呢,根据提示可知需要进到BIOS修改配置。第一步:进入到BIOS不同品牌的笔记本和台式机进入的方法会有所不同,一般有如下三种方式:1、台式机Award BIOS:按“Del”键;2、台式机AMI BIOS:按“Del”键或者“Esc”键;3、大部分笔记本的BIOS:按“F2”键,也有按“F10”键的;我的是笔记本,开机时不停的按F10就进入到BIOS界面。第二步:选择标题advanced选项:第原创 2021-07-24 21:29:22 · 21020 阅读 · 5 评论 -
rhel6.7离线安装sklearn记录
sklearn在redhat6.7下的离线安装原创 2016-11-15 11:53:31 · 1467 阅读 · 0 评论