使用IPython探索和可视化数据

推荐使用 Anaconda.它是一个预编译的科学Python套件。(或者Enthougt)

  1. 下载 Anaconda-2.3.0-Linux-x86_64.sh 并copy到/usr/local/apps目录下,运行 bash Anaconda-2.3.0-Linux-x86_64.sh完成安装。

  2. 更新环境变量:在/home/hadoop/.bashrc中添加export PATH=/usr/local/apps/anaconda/bin:$PATH

  3. 如果使用IPython3.0 ;使用如下方式更新
    conda update conda
    conda update ipython ipython-notebook ipython-qtconsole

  4. 然后安装或者更新jupyter(IPython3.x以上):
    conda install jupyter或者conda update jupyter

  5. 将集群中的机器做同样的配置;启动hadoop,spark;用如下命令启动pyspark终端:
    IPYTHON=1 IPYTHON_OPTS="--pylab" ./bin/pyspark
    这样在启动的pyspark可以一起启用IPython和pylab。
    显示如下,启动成功

    IPython 4.0.0 -- An enhanced Interactive Python.
    ?         -> Introduction and overview of IPython's features.
    %quickref -> Quick reference.
    help      -> Python's own help system.
    object?   -> Details about 'object', use 'object??' for extra details.
    Using matplotlib backend: Qt4Agg
    

    遇到问题:
    使用xshell远程连接主机,同样命令会报cannot connect to X server错误,暂时没有解决。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值