CENTOS7 Anaconda+Jupyter+Pyspark联合安装

本文详细介绍如何在线及离线安装Anaconda,并配置Python虚拟环境,包括jupyter notebook的连接与使用,以及如何配置离线环境和连接pyspark。
部署运行你感兴趣的模型镜像

目录

1、 安装anaconda(在线)
2、 连接jupyter notebook(在线)
3、离线Anaconda配置
4、离线Python环境配置(虚拟环境)
5、 jupyter notebook 连接pyspark

1、 安装anaconda(在线)

1.1、 下载anaconda

1)在终端输入(x86系统)

wget https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh

报错

wget:commend not found 
# 没有wget命令则用yum安装,在终端输入:
yum install wget -y

2)在终端输入(Arm系统)

wget https://github.com/Archiconda/build-tools/releases/download/0.2.3/Archiconda3-0.2.3-Linux-aarch64.sh

1.2、 安装,在终端输入

bash Anaconda3-2020.02-Linux-x86_64.sh

点击Enter,出现安装条例,一直Enter键直至出现是否同意,输入yes,最后确定安装位置。

1.3、 激活环境,在终端输入

source ~/.bashrc

1.4、 建立python虚拟环境,在终端输入

conda create -n pytorch(env_name) python==3.7.0

1.5、 激活环境

conda activate pytorch
问题:

1、在1.2步安装过程中可能出现

bunzip2 connot find

解决

yum install bzip2

2、 连接jupyter notebook(在线)

2.1 进入虚拟环境

conda activate pytorch(env_name)

2.2 在虚拟环境中安装jupyter,在终端输入

conda install jupyter

2.3 生成jupyter的配置文件,在终端输入

jupyter notebook --generate-config

2.4 修改配置文件,在终端输入

vim ~/.jupyter/jupyter_notebook_config.py

将如下几项内容去除注释后修改值如下并保存:

# 服务ip地址,0.0.0.0代表绑定到本机所有的ip上
# c.NotebookApp.ip='0.0.0.0'
# 工作端口
c.NotebookApp.port =8888 # 随便指定一个端口
# 共享目录
c.NotebookApp.notebook_dir = 'xxxxxxx' # 设置Jupyternotebook 打开的根目录

2.5 配置防火墙封端口

firewall-cmd --zone=public --add-port=8888/tcp –permanent
sudo systemctl restart firewalld

2.6 修改密码

重置jupyter notebook密码,在终端输入

jupyter notebook password

然后输入设置的密码即可。

2.7 为jupyter notebook添加conda的内核

在虚拟环境中安装插件,在终端输入

conda install nb_conda

2.8 运行jupyter notebook,在虚拟环境下启动,在终端输入

jupyer notebook

如果是管理员则输入

jupyer notebook --allow-root

然后输入设置的密码即可。

可能报错:

在这里插入图片描述

解决方案:将所缺失文件设置成一个软连接,连接到该目录下同一性质文件,这里报错是缺失libffi.so.7文件,但是该目录下存在libffi.so.6文件,故将其软连接于libffi.so.6文件上,问题得到解决。

目录为虚拟环境中的lib文件夹

cd ~/anaconda/envs/env_name/lib
ln -s libffi.so.6 libffi.so.7

3、离线Anaconda配置

3.1、将离线下载的Anaconda安装包导入离线环境中

3.2、安装,终端输入命令

bash Archiconda3-0.2.3-linux-aarch64.sh

点击Enter,出现安装条例,一直Enter键直至出现是否同意,输入yes,最后确定安装位置。(同上)

3.3、激活环境

source ~/.bashrc

4、离线Python环境配置(虚拟环境)

4.1、将在线配置好的虚拟环境env_name打包,压缩虚拟环境

tar -cvf env_name.tar env_name/

4.2、使用U盘或者ssh将压缩后的文件传输到服务器

4.3、将压缩包复制到服务器上的anaconda3/envs目录下,并解压,在终端输入

tar -xvf env_name.tar  # 解压

4.4、打开环境

conda activate env_name

5、 jupyter notebook 连接pyspark

在master服务器端,添加的~/.bashrc文件中添加如下环境变量:

 vim ~/.bashrc
#py-spark
export PYTHONPATH = /spark/python:$PYTHONPATH #pythonpath指向spark目录下的python文件夹
export PYTHONPATH = /spark/python/lib/py4j-0.10.7-src.zip:$PYTHONPATH #指向py4j包,没有的话下载一个
export PYSPARK_PYTHON=/anaconda3/envs/envs_name/bin/python3 #使用虚拟环境中的python3
export PYSPARK_DRIVER_PYTHON=/anaconda3/envs/envs_name/bin/jupyter #使用虚拟环境中的jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook --ip=’0.0.0.0’ --no-browser --allow-root"

在服务器端输入

pyspark

则会同样打印出访问链接,输入到本地浏览器访问即可。

此时的jupyter类似在终端启的一个pyspark-shell ,所以在启用jupyter时可以定义任务资源,如下

nohup pyspark --master yarn --deploy-mode client --driver-memory 20g --driver-cores 1 --num-executors 10 --executor-memory 6g --executor-cores 1 --conf spark.yarn.executor.memoryOverhead=8192  --conf spark.default.parallelism=800 &

"nohup"是定义在终端关闭后,jupyter程序仍在运行(常规的jupyter任务也可以用,很强大的功能);后面是定义的资源大小,可根据实际的情况配置。
关闭nohup进程
若想要关闭nohup jupyter,可以执行以下操作:

#查看进程
ps -aux | grep jupyter
#结束进程
kill -9 xxxx(进程号)

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

### 安装准备 为了在 CentOS 7 上成功安装 Anaconda 及其附带的 Jupyter Notebook,需先确认系统的更新状态并确保有必要的依赖项已安装。通常情况下,Anaconda 的官方版本会自带最新版的 Jupyter Notebook。 ### 下载 Anaconda 通过 wget 命令从清华大学开源软件镜像站获取适用于 Linux x86_64 架构的 Anaconda3 版本[^4]: ```bash wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.1-Linux-x86_64.sh ``` ### 执行安装脚本 运行下载好的 Shell 脚本来完成 Anaconda安装过程[^2]: ```bash bash Anaconda3-5.0.1-Linux-x86_64.sh ``` 注意,在执行上述命令前应检查所使用的具体版本号是否匹配实际需求。 ### 配置环境变量 安装完成后,建议将 Anaconda 添加到 PATH 中以便于全局调用 Python 或者 conda 等工具。这一步可以通过编辑用户的 `.bashrc` 文件来实现[^3]: ```bash echo &#39;export PATH="/home/user_name/anaconda3/bin:$PATH"&#39; >> ~/.bashrc && source ~/.bashrc ``` 这里的 `user_name` 应替换为当前登录用户名的实际名称。 ### 初始化 Jupyter Notebook 对于希望远程连接至服务器上的 Jupyter Notebook 用户来说,创建一个新的配置文件是必不可少的操作之一[^5]: ```bash jupyter notebook --generate-config ``` 此操作会在用户家目录下的隐藏文件夹 `.jupyter` 内生成名为 `jupyter_notebook_config.py` 的配置文档。 ### 设置密码保护与IP绑定 出于安全考虑,应当设置访问密码,并允许特定 IP 地址范围内的设备可以访问该服务。修改刚才提到过的配置文件中的相应参数即可达成目的[^1]: ```python from notebook.auth import passwd passwd() ``` 以上代码片段用于生成哈希加密后的口令字符串;随后将其填入如下所示位置: ```python c.NotebookApp.password = u&#39;sha1:<hash_value>&#39; c.NotebookApp.ip = &#39;*&#39; c.NotebookApp.open_browser = False c.NotebookApp.port = 8888 ``` 这里假设端口号设定为默认值即 8888。 ### 启动 Jupyter Notebook 最后便是正式启动 Jupyter Notebook 服务了。如果一切顺利的话,此时应该可以在本地计算机上打开网页浏览器并通过指定 URL 访问远端主机所提供的交互式编程界面: ```bash jupyter notebook ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值