前两天把python基础语法看了下,简单做了点练习,今天开始做了第一个python爬虫项目,用了scrapy框架,从安装python开始记录下步骤。
一。安装python和pycharm
1.从官网:https://www.python.org/downloads/ 下载python3.6.5,不装在默认位置,我选择安装在D:\py\python3.6.5下。
2.从官网:http://www.jetbrains.com/pycharm/ 下载pycharm,选择professional版,安装在D:\ProgramFiles下,安装路径不要有空格,不然无法安装。
3.设置python环境变量:在path下添加python的安装路劲 D:\py\python3.6.5\python.exe
二。安装scrapy库
scrapy库安装可费劲了,安装过程两部一个坑,感觉跟配置spring xml一样哈哈,扯远了。下面我们就来看看具体步骤。
网上很多教程都教我们在命令行里安装,其实这样挺麻烦的,既然有工具,为什么不用工具呢!OK,我们打开刚安装好的pycharm,新建一个工程,注意新建工程时有个选项 Project Virtual Interpreter,点开,选择Existing interpreter,选择我们上面安装好的python.exe,不然pycharm就会创建新的python环境,我们前面已经安装好了,这不是多此一举嘛。
然后一次点击File-Default Settings-Project Interpreter,在Project Interpreter那里选择我们上面安装好的python.exe
然后点击File-Settings-Project Interpreter,这里的Project Interpreter应该也更新了。点击右侧的绿色加号,搜索要安装的包,点击install package依次安装以下库:
1.lxml
2.zope.interface
3.twisted:安装时可能会提示error:Microsoft Visual C++ 10.0 is required (Unable to find vcvarsall.bat),改为手动安装。
https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml 在这个网站下载对应的twisted库,我的python版本是3.6.5,所以选择