王俊宇939-优快云博客

hadoop-env.sh：指定 JDK 路径 export JAVA_HOME=/usr/local/jdk🔶1-136🔶。yarn-env.sh：修改 JDK 路径 export JAVA_HOME=/usr/local/jdk。Hadoop 解压与权限设置。YARN 36配置与资源管理。HDFS 33配置文件修改。

2025-06-16 13:21:32 285

原创一、JDK 安装与环境变量配置

执行 source /etc/profile 使配置生效，输入 java -version 验证版本（如 1.8.0_201）🔶1-112🔶。建议重启虚拟27机，确保环境变量全局生效。JDK 解压与软链接创建。环境变量配26置与验证。

2025-06-16 13:20:13 139

原创二、10Ubuntu 系统基础配置与工具安装

【代码】二、10Ubuntu 系统基础配置与工具安装。

2025-06-16 13:18:54 193

原创一、VMWare 搭建 Ubuntu 20.04 虚拟机详细步骤

启动 VMWare 后，通过 “文件→新建虚拟机” 打开向导，选择 “典型” 配置，指定 Ubuntu 系统镜像文件（如 ubuntu-20.04.4-desktop-amd64.iso）。关闭虚拟机后，编辑虚拟机设置，建议分配 4GB 内存和 2 个处理器核心（内存至少 2GB，避免运行 Hadoop、Spark 时内存不足）安装完成后，登录 Ubuntu 系统（用户名 / 密码：spark/spark），跳过初始设置中的网络账号、更新提示等，保持系统版本稳定。

2025-06-16 13:17:37 340

原创一、Ubuntu 虚拟机的安装

选择 Ubuntu 系统 ISO 镜像（如 ubuntu-20.04.4-desktop-amd64.iso），设置用户名和密码为「spark」以便统一管理。分配磁盘空间为 60GB（按需增长），可自定义硬件配置（如 4GB 内存、2 核 CPU）以确保 Hadoop 和 Spark 运行稳定。启动 VMWare，点击「文件」→「新建虚拟机」，选择「典型」配置。安装完成后，登录界面输入用户名「spark」和密码「spark」。优化任务栏：右键移除不常用图标，固定终端图标以便后续操作。

2025-06-15 12:33:32 181

2503_90813086的博客

原创 ortBy 排序：灵活控制排序规则

原创四、1617转换操作链：组合使用提升数据处理效率

原创三、1314filter 筛选：按条件保留元素

原创二、11flatMap 转换：扁平化元素集合

原创 Spark RDD 转换操作实战：map、flatMap 与 filter 的核心应用

原创二、23从文本文件创建 RDD：本地与 HDFS 数据源

原创一、通过 parallelize () 从集合创建 RDD

原创 Pip 安装与镜像源配置

原创 Spark 功能测试与 SparkShell 交互

原创 Spark 安装与环境变量配置

原创四、3943HDFS 与 YARN 服务启动与测试

原创三、32Hadoop 安装与核心组件配置

原创一、JDK 安装与环境变量配置

原创二、10Ubuntu 系统基础配置与工具安装

原创一、VMWare 搭建 Ubuntu 20.04 虚拟机详细步骤

原创一、Ubuntu 虚拟机的安装

空空如也

空空如也