虚拟机ubuntu18.04环境下hadoop2.9和hive3.0安装

本文详细介绍了如何在Ubuntu 18环境下搭建Hadoop集群,包括基础环境配置、Hadoop及Hive的安装步骤、MySQL安装配置、虚拟机IP地址设置等关键环节。

一、基础环境和下载

环境:ubuntu18,64位

虚拟机:virtualbox5.2

下载hadoop2.9.1 https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/

下载jdk1.8.0 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

下载hive3.0.0 https://mirrors.tuna.tsinghua.edu.cn/apache/hive/

二、创建HADOOP用户

sudo useradd -m hadoop -s /bin/bash

设置密码

sudo passwd hadoop

增加管理员权限

sudo adduser hadoop sudo


三、更新软件,安装ssh

sudo apt-get update

sudo apt-get install vim

sudo apt-get install openssh-server

登陆本机:

ssh localhost

exit                           # 退出刚才的 ssh localhost
cd ~/.ssh/                     # 若没有该目录,请先执行一次ssh localhost
ssh-keygen -t rsa              # 会有提示,都按回车就可以

cat ./id_rsa.pub >> ./authorized_keys  # 加入授权


四、安装java,配置环境

tar -zxvf jdk-8u171-linux-x64.tar.gz
配置环境变量
sudo gedit /etc/profile
末尾加上
export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_21  
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH  
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH 
终端输入
source /etc/profile

五、安装hadoop

sudo tar -zxf hadoop-2.9.1.tar.gz -C /usr/local    # 解压到/usr/local中
定位到/usr/local 
sudo mv ./hadoop-2.9.1/ ./hadoop            # 将文件夹名改为hadoop
sudo chown -R hadoop ./hadoop       # 修改文件权限

验证是否安装成功

cd /usr/local/hadoop

./bin/hadoop version

安装成功会显示版本


六、修改配置文件

gedit ./etc/hadoop/core-site.xml

<configuration>
        <property>
             <name>hadoop.tmp.dir</name>
             <value>file:/usr/local/hadoop/tmp</value>
             <description>Abase for other temporary directories.</description>
        </property>
        <property>
             <name>fs.defaultFS</name>
             <value>hdfs://localhost:9000</value>
        </property>
</configuration>

gedit ./etc/hadoop/hdfs-site.xml

<configuration>
        <property>
             <name>dfs.replication</name>
             <value>1</value>
        </property>
        <property>
             <name>dfs.namenode.name.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/name</value>
        </property>
        <property>
             <name>dfs.datanode.data.dir</name>
             <value>file:/usr/local/hadoop/tmp/dfs/data</value>
        </property>
</configuration>

gedit ./etc/hadoop/hadoop-env.sh

修改java环境变量(你安装的位置) export JAVA_HOME=/lib/jdk1.8.0_171

执行 NameNode 的格式化:

./bin/hdfs namenode -format


开启 NameNode 和 DataNode 守护进程

./sbin/start-dfs.sh


启动完成后,可以通过命令 jps 来判断是否成功启动


关闭命令sbin/stop-dfs.sh

可以打开http://localhost:50070/查看 NameNode 和 Datanode 信息,还可以在线查看 HDFS 中的文件。


七、安装mysql

第一次安装调用不出来mysql,所以决定卸载重安就可以了

sudo apt-get install mysql-server
sudo apt install mysql-client
sudo apt install libmysqlclient-dev

先清除之前的安装信息

sudo apt-get autoremove --purge mysql-server-5.0
sudo apt-get remove mysql-server
sudo apt-get autoremove mysql-server

sudo apt-get remove mysql-common 

清理残留数据

dpkg -l |grep ^rc|awk '{print $2}' |sudo xargs dpkg -P

再次安装

sudo apt-get install mysql-server

sudo apt-get install mysql-client

设置mysql允许远程访问

终端输入sudo gedit /etc/mysql/mysql.conf.d/mysqld.cnf

注释掉bind-address = 127.0.0.1

在mysql中输入

grant all on *.* to root@'%' identified by '你的密码' with grant option;

flush privileges;

在终端中重启mysql

service mysql restart


八、复制这个ubuntu系统

右击ubuntu,选择“复制”,选择初始化mac地址,确定,“完全复制”,复制出两个新的ubuntu系统,命名为ubuntu2和ubuntu3



九、更改ubuntu2和ubuntu3的IP地址

复制出来的虚拟机IP地址是重复的,需要修改

在/etc/netplan中找到后缀名为.yaml的文件,打开终端

sudo gedit 01-network-manager-all.yaml

network:
    ethernets:
        enp0s3:
            addresses:
            - 192.168.0.2/20
            gateway4: 192.168.12.2
            nameservers:
                addresses:
                - 223.5.5.5
                search: []
            optional: true
    version: 2

保存退出,在终端中输入:sudo netplan apply,使之生效

在终端中输入ifconfig可查看ip




三个虚拟机的ip分别是192.168.0.1,192.168.0.2,192.168.0.3


十、修改3个系统的主机名字

查看当前主机的主机名称:sudo /bin/hostname

设置当前主机的主机名称:sudo /bin/hostname newname

三个主机名字分别是master,slave1,slave2

定位到/etc,打开终端sudo gedit hosts

192.168.0.1    master
192.168.0.2    slave1
192.168.0.3    slave2

手动重启网络服务生效:sudo /etc/init.d/networking restart


十一、



十二、



参考:http://www.powerxing.com/install-hadoop/

<think>我们正在Ubuntu18.04虚拟机安装CUDA。根据引用,有几种安装方式:deb安装runfile安装。我们将参考引用[1]的deb安装步骤引用[2]的runfile安装说明。注意:在虚拟机安装CUDA,需要先确保虚拟机有足够的资源(如显存分配,但虚拟机通常使用虚拟显卡,所以CUDA可能用于CPU计算或需要直通物理GPU)。如果虚拟机没有NVIDIAGPU直通,CUDA可能无法使用GPU加速,但可以安装用于开发。步骤概述:1.确保系统更新并安装依赖。2.安装合适的NVIDIA驱动(CUDA通常包含驱动,但虚拟机中可能需要额外考虑)。3.选择安装方式(deb或runfile)并按照步骤安装CUDA。4.配置环境变量。由于是虚拟机,我们需要考虑:-虚拟机是否支持GPU直通?如果不支持,安装CUDA只能使用CPU模式(部分功能受限)。-如果支持直通,需要先配置虚拟机设置并安装对应的驱动。根据引用[1]的deb安装步骤(针对CUDA10.2):步骤1:下载并移动pin文件步骤2下载deb安装包并安装步骤3:添加密钥步骤4:更新并安装CUDA但引用[2]提供了CUDA11.4的runfile安装方式。由于用户没有指定CUDA版本,我们可以选择较新的版本(如11.4)或者根据需求选择。我们这里以deb方式安装CUDA11.4为例(因为引用[2]提到CUDA11.4,且提供了下载链接,但步骤是runfile,我们可以从官网获取deb安装方式)。实际上,CUDA的官方下载页面会提供不同安装方式的指导。根据引用[2]的链接,我们可以选择runfile,但为了与引用[1]的步骤类似,我们也可以选择deb安装。注意:在安装CUDA之前,需要先安装NVIDIA驱动。根据引用[3],如果系统没有检测到驱动,可以添加ppa源并安装推荐驱动。综合步骤:1.准备工作:-更新系统:```bashsudoaptupdatesudoaptupgrade-y```-安装依赖:```bashsudoaptinstallbuild-essential-y```2.安装NVIDIA驱动(如果尚未安装):-首先,检查是否有推荐驱动:```bashubuntu-driversdevices```如果这个命令没有输出(如引用[3]所述),则添加ppa源:```bashsudoadd-apt-repositoryppa:graphics-drivers/ppasudoaptupdate```-然后再次运行`ubuntu-driversdevices`,会列出推荐驱动。安装推荐驱动(通常标记为recommended):```bashsudoaptinstallnvidia-driver-<版本号>#例如nvidia-driver-470```-重启虚拟机(如果驱动安装成功,且虚拟机支持直通,则nvidia-smi应该可以运行)。3.安装CUDA:有两种方式:debrunfile。这里提供deb方式(参考CUDA官方文档,以11.4为例):-访问CUDA下载页面(https://developer.nvidia.com/cuda-11-4-0-download-archive),选择:OperatingSystem:LinuxArchitecture:x86_64Distribution:UbuntuVersion:18.04InstallerType:deb[local]-按照网页上生成的命令执行:```bashwgethttps://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pinsudomvcuda-ubuntu1804.pin/etc/apt/preferences.d/cuda-repository-pin-600wgethttps://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda-repo-ubuntu1804-11-4-local_11.4.0-470.42.01-1_amd64.debsudodpkg-icuda-repo-ubuntu1804-11-4-local_11.4.0-470.42.01-1_amd64.debsudoapt-keyadd/var/cuda-repo-ubuntu1804-11-4-local/7fa2af80.pubsudoapt-getupdatesudoapt-get-yinstallcuda```注意:这里下载的deb包名称密钥路径可能根据版本变化,请以官网生成的命令为准。4.配置环境变量:在~/.bashrc文件中添加:```bashexportPATH=/usr/local/cuda-11.4/bin${PATH:+:${PATH}}exportLD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}```然后执行:```bashsource~/.bashrc```5.验证安装:```bashnvcc--version```如果输出CUDA版本信息,则安装成功。注意:在虚拟机中,如果没有直通物理GPU,则无法使用GPU加速,但CUDA工具链可以安装。此时,运行CUDA程序可能会使用CPU模拟(如使用CUDA的emulator模式),但这不是官方支持的生产环境。如果虚拟机支持GPU直通(如VMware的vGPU或KVM的VFIO直通),则需要在虚拟机设置中分配GPU,并确保宿主机驱动虚拟机驱动正确安装。引用[4]提到在JetsonXavierNX上安装,但那是嵌入式设备,与普通虚拟机不同,所以仅供参考。因此,在虚拟机安装CUDA的关键是确保虚拟机可以访问到物理GPU。否则,安装的CUDA只能用于编译等操作,无法实际使用GPU计算。相关问题:1.如何检查Ubuntu虚拟机是否支持NVIDIAGPU直通?2.虚拟机安装CUDA后,如何编译并运行一个简单的CUDA程序?3.如果没有物理GPU,如何在Ubuntu18.04安装CUDA并运行使用CPU的CUDA程序?</think>### 在Ubuntu 18.04虚拟机安装配置CUDA #### 一、安装前准备 1. **系统更新** ```bash sudo apt update && sudo apt upgrade -y sudo reboot # 重启生效 ``` 2. **安装依赖项** ```bash sudo apt install build-essential libgl1-mesa-dev freeglut3-dev -y ``` 3. **禁用Nouveau驱动** ```bash echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf sudo update-initramfs -u sudo reboot # 重启使禁用生效 ``` #### 二、安装NVIDIA驱动(关键步骤) 1. **添加官方驱动仓库** ```bash sudo add-apt-repository ppa:graphics-drivers/ppa -y sudo apt update ``` 2. **检测推荐驱动版本** ```bash ubuntu-drivers devices # 查看recommended版本 ``` 3. **安装驱动**(以470版本为例) ```bash sudo apt install nvidia-driver-470 -y sudo reboot ``` 4. **验证驱动** ```bash nvidia-smi # 应显示GPU信息 ``` #### 三、安装CUDA Toolkit **方法1:deb安装(推荐)** ```bash wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600 wget https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda-repo-ubuntu1804-11-4-local_11.4.0-470.42.01-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu1804-11-4-local_11.4.0-470.42.01-1_amd64.deb sudo apt-key add /var/cuda-repo-ubuntu1804-11-4-local/7fa2af80.pub sudo apt-get update sudo apt-get -y install cuda ``` **方法2:runfile安装** ```bash wget https://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda_11.4.0_470.42.01_linux.run sudo sh cuda_11.4.0_470.42.01_linux.run # 安装时取消勾选Driver(已单独安装驱动) ``` #### 四、环境配置 1. **添加PATH变量** 编辑`~/.bashrc`: ```bash echo &#39;export PATH=/usr/local/cuda-11.4/bin${PATH:+:${PATH}}&#39; >> ~/.bashrc echo &#39;export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}&#39; >> ~/.bashrc source ~/.bashrc ``` 2. **验证安装** ```bash nvcc --version # 应显示CUDA版本 ``` #### 五、测试CUDA功能 1. **编译示例程序** ```bash cd /usr/local/cuda-11.4/samples/1_Utilities/deviceQuery sudo make ./deviceQuery # 输出Result = PASS即成功 ``` 2. **带宽测试** ```bash cd ../bandwidthTest sudo make ./bandwidthTest ``` #### 虚拟机注意事项 1. **GPU直通要求** - 需启用VT-d/IOMMU(BIOS设置) - VMware:开启`hypervisor.cpuid.v0=FALSE` - VirtualBox:启用3D加速 2. **显存分配** 建议分配至少4GB显存(通过虚拟机设置调整) 3. **驱动冲突处理** 若出现`Failed to initialize NVML`错误,执行: ```bash sudo nvidia-modprobe -u -c=0 ``` > **安装要点总结** > 1. 驱动与CUDA版本需匹配(如470驱动配CUDA 11.4) > 2. 虚拟机需配置GPU直通才能使用硬件加速[^1][^2] > 3. 通过`nvidia-smi``deviceQuery`双重验证安装
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值