- 博客(3)
- 收藏
- 关注
原创 豆瓣电影Top250 步骤解析
大致的流程是:1.发送请求 2.接受信息,提取信息 3.保存信息 发送请求 1.用到的库是urllib .==urllib.requst.urlopen(url,head)==是发送语句,它返回的是网页的源代码,也是我们要的信息,只不过后面要提取。url是我们的目的网址,head是我们要伪装的头部。代码readurllib.requat.Requst{ A} 其中的A是字典的形式,也可以是列表包含字典。 2.response=urill.requst.urlopen(url,head) ,ht
2020-07-31 23:07:27
3521
原创 pycharm同时安装python2和python3,及python3 使用pip来搭建库的注意事项
背景: 因为之前pycharm一直都是安装的是python2,但是因为要学爬虫且python2 的一些库现在不在维护,所以打算安装python3. 安装python3 在官网上面下载python3.6 安装时勾选AddPython3.6 to PATH,在Advanced Options中不建议勾选后面debug两项,然后点击Inatall进行安装 安装python2 和上面一样,因为是很近之前弄的,所以不怎么记得了 环境变量配置 右键 --我的电脑,选择–高级系统设置,选择–高级,点击–环境变.
2020-07-30 10:14:52
1212
原创 python 爬虫的库的搭建(beautifulsoup4,urllib库的搭建)
环境:python2.7 pycharm5 一. beautifulsoup4第一种方法 **注意**:我这里有两个python,一个在c:\python27另外一个在c:\usesr;c:\python27的这个是经常用的,里面有setuptools,另外一个没有这个库。 而打开cmd默认的是在c:\usesr里面进行的,如果直接输入python,然后再输入setup.py instal,会出现SyntaxError: invalid syntax提示。 所以要先
2020-07-29 17:40:23
203
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人