Python爬虫
TroKey
我现在单身没有任何家庭负担可以全身心的投入工作
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
第一个爬虫,爬取腾讯课堂课名列表
最近开始学习爬虫,还是比较习惯python的简洁,所以选择用python写爬虫。 python爬虫有很多框架,比如Scapry等,还有一些分布式框架,刚学还是一步一步来,以后再谈框架。 首先,python3+提供的requests库很强大,能够满足一般人的爬虫需求。今天就先写一个爬取腾讯课堂课名列表的小程序。 先上代码,后解析: import requests from bs4 im...2016-04-29 10:52:30 · 2677 阅读 · 0 评论 -
python网络爬虫(一,抓取网页的含义和URL基本构成)
1,网络爬虫的定义 网络爬虫(Web Spider),把互联网比作一张蜘蛛网,Spider就是在这张蜘蛛网上面爬来爬去的蜘蛛。Spider从网站的某一个页面开始读取网页内容,找到这个网页的链接地址,然后通过这个链接地址找下一个网页内容,这样一直循环直到将整个网站的所有网页抓取完为止。 2,浏览网页的过程 浏览器中输入“www.baidu.com”后,向服务器发送了一次请求,把服务端的文件...原创 2015-11-18 10:22:22 · 519 阅读 · 0 评论 -
爬取网站图片,并下载保存到指定文件夹
源码如下: # -*- coding: utf-8 -*- # @Time : 2017/5/18 17:38 # @Author : xiaojingjing # @Site : # @File : finde_mmimg.py # @Software: PyCharm import urllib.request import os,shutil ...原创 2017-05-19 12:31:11 · 1650 阅读 · 0 评论
分享