ubuntu 14.04 安装scrapy

本文档详细介绍了在Ubuntu 14.04上安装Scrapy爬虫框架的步骤,包括更新系统、安装Gnome经典界面、设置必要的依赖如pip、lxml、openssl,以及安装python-webkit、libwebkitgtk、jswebkit、PyWebkitDFB、libcurl4和Xvfb等相关软件包,确保Scrapy能够执行JavaScript并处理HTML解析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

首先,更新ubuntu

sudo apt-get install update

sudo apt-get install upgrade


安装ubuntu经典gnome界面

sudo apt-get install gnome-session-fallback

安装前准备

1. 安装pip

sudo apt-get install python-pip


2. 安装setuptools

wget https://bootstrap.pypa.io/ez_setup.py -O - | sudo python

3. 安装lxml

sudo apt-get install python-lxml

sudo apt-get install libxml2-dev libxslt-dev python-dev
判断是否成功:import lxml


4.安装openssl

sudo apt-get install libffi-dev

sudo apt-get install libssl-dev libssl0.9.8 libgtk2.0-dev

判断是否安装成功: import OpenSSL

5. 安装scrapy

sudo pip install scrapy

判断是否成功: scrapy


安装其他scrapy抓取相关软件:

1. python-webkit 在scrapy抓取数据时执行js代码

sudo apt-get install python-webkit

还有一些相关的包需要安装

https://wiki.python.org/moin/PythonWebKit

apt-get install python-dev python-ply

http://www.gnu.org/software/pythonwebkit/

libwebkitgtk最新的是3.0

sudo apt-get install libwebkitgtk-3.0-0


2. 安装 jswebkit   这个有可能会在上一步没装上, 需要自己重新装一下

sudo apt-get install python-jswebkit


3. 安装 pyjamas

https://github.com/pyjs/pyjs/wiki/pyjamasubuntuwebkitgtk

Install libwebkit for it's dependencies, and then remove it:

sudo apt-get build-dep libwebkit-dev
sudo apt-get install libwebkit-dev
sudo apt-get remove libwebkit-dev


sudo apt-get install pyjamas

https://wiki.python.org/moin/PyjamasDesktop

如果上面的命令无法安装则到https://launchpad.net/ubuntu/+source/pyjamas找到deb包安装


4. 安装  PyWebkitDFB

sudo apt-get install libdirectfb-dev

http://www.gnu.org/software/pythonwebkit/


5. 安装 libdirectfb-extras 这个包含一个X11的插件, 通过编辑~/.directfb 并且加入下面两行

system=x11
force-windowed

软件包如下:

libdirectfb-1.2-9-dbg 

libdirectfb-extra-dbg


6. 安装ibcurl4

sudo apt-get install libcurl4-gnutls-dev


7. Xvfb 适用非Xwindows环境时

sudo apt-get install xvfb

8. beautifulsoup  python html/xml parser

sudo apt-get install python-bs4




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值