
大数据
文章平均质量分 53
大数据笔记
枫尘三戒
一个人的成功最大的特点就是不能懒惰,每一个牛b的人物背后,都有一段苦逼的岁月,正因为他们曾经像sb一样的坚持,才有今天凤凰涅槃般的改变
展开
-
【Hive DQL之表连接】
11-------------------------Full join ----你有,我有,--你有,我没有---, 你没有,我有 ---- 两表全都显示,--笛卡尔积-----每一一个join一遍 -----数据量大的吓人 6 * 6 = 36 -------------------------------------------------hive (mydb)> select * from u1 join u2 on u1.id = u2.id;WAR.原创 2022-01-12 23:09:19 · 695 阅读 · 0 评论 -
良师讲解三百遍,不如自身来实战--悟字诀--from today--group by having where 已参悟
原创 2022-01-10 23:06:41 · 241 阅读 · 0 评论 -
linux123:50070 解析不了问题的解决方法
linux123:50070 解析不了1.查看映射的IP地址可以访问:2.ping 服务器 /etc/hosts 文件中本地文件映射的hostname可以ping通3. windows 电脑hosts文件中添加和服务器中一样的IP映射4.再次通过主机名访问,成功解析...原创 2021-10-03 21:56:28 · 282 阅读 · 0 评论 -
Apache Hadoop 完全分布式集群搭建-分发配置(三)
分发配置编写集群分发脚本rsync-scriptrsync 远程同步工具rsync主要用于备份和镜像。具有速度快、避免复制相同内容和支持符号链接的优点。rsync和scp区别:用rsync做文件的复制要比scp的速度快,rsync只对差异文件做更新。scp是把所有文件都复制过去。基本语法命令 选项参数 要拷贝的文件路径/名称 目的用户@主机:目的路径/名称2. 选项参数说明rsync -rvl pdir/pdir/pdir/fname user@us.原创 2021-10-03 16:30:21 · 190 阅读 · 0 评论 -
Apache Hadoop 完全分布式集群搭建(二)
集群环境规划框架linux121linux122linux123HDFSNameNode、DataNodeDataNodeSecondaryNameNode、DataNodeYARNNodeManagerNodeManagerResourceManager一、安装Hadoop登录linux121节点;进入/opt/lagou/software,解压安装文件到/opt/lagou/serverstar -zxvf hadoop-2.9.2.tar.gz -原创 2021-10-03 14:40:27 · 115 阅读 · 0 评论 -
搭建hadoop大数据集群环境-环境准备(一)
搭建hadoop大数据集群环境-环境准备第一部分:主机环境准备linux 虚拟机-静态IP地址配置linux123:IP: 192.168.27.131子网掩码:255.255.255.0网关:192.168.27.2linux122:IP: 192.168.27.130子网掩码:255.255.255.0网关:192.168.27.2linux121:IP: 192.168.27.129子网掩码:255.255.255.0网关:192.168.27.2一、静态IP配置I原创 2021-10-03 00:37:08 · 374 阅读 · 0 评论