
爬虫
xman4code
这个作者很懒,什么都没留下…
展开
-
python 爬虫 (1)urllib的使用
python中可以很方便的使用一些集成的库进编写爬虫。 由于IDE使用的是pycharm所以先说明在pycharm中怎么引用库。 1 file 2 settings 3 自己的工程名字 4 点击加号 5 搜索所需库 6 选择所需库 7 安装 ...原创 2018-07-02 22:55:48 · 213 阅读 · 0 评论 -
python爬虫(2) urllib库
urllib库是很常用的解析网络资源的库,python3之后就没有了urllib和urllib2的区分,urllib和urllib2合并后统称为urllib,其中包含urllib.request/urllib.erro/urllib.parse/urllib.robotparse以下是两个版本的使用方法对比: urllib/urllib2 urllib urllib....原创 2018-07-02 23:47:58 · 224 阅读 · 0 评论 -
python爬虫(3)将抓取的网页存入文件
在抓取完数据后尝试将数据存到文件里。首先看了一下python简单的存取数据的例子: 首先新建一个saveString.py的文件,通过查找文件在D:/learn/python/untitled/ 目录下。在saveString.py里写入如下代码:fileOb = open('saveString.txt','w') #打开一个文件若没有就新建一个fileOb.write('hello...原创 2018-07-10 17:45:00 · 5100 阅读 · 0 评论