Python爬虫
早起的鸟儿有虫吃h
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python爬虫 爬取糗事百科段子
# -*- coding:utf-8 -*- import urllib import urllib2 import re page = 1 url = 'http://www.qiushibaike.com/hot/page/' + str(page) user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (原创 2017-04-07 20:51:00 · 676 阅读 · 0 评论 -
关于HTTP协议,一篇就够了
HTTP协议 讲解转载 2017-07-02 17:24:24 · 410 阅读 · 0 评论 -
Ubuntu 中 crontab 用法 以及 执行Python文件
cron是一个Linux下的后台进程,用来定期的执行一些任务。因为我用的是Ubuntu,所以这篇文章中的所有命令也只能保证在Ubuntu下有效,但其他系统应该也差不多。 想要让cron执行你指定的任务,首先就要编辑crontab文件。crontab是一个文本文件,用来存放你要运行的命令。你可以以下命令 Shell代码 crontab -e 来打原创 2017-07-07 17:15:46 · 3666 阅读 · 0 评论 -
Python3 安装 BuiltWith 模块
Python3 安装 BuiltWith 模块 原作者 :https://www.iflei.com/python3-builtwith-module-installation.html BuiltWith是一个网站技术信息查询工具,开发团队来自于澳大利亚。利用该网站所提供的功能,你可以查询出某网站背后是由哪些技术来支持的,比如操作系统的类型、所采用的访问量统计服务、采用的发布转载 2017-07-07 23:08:44 · 675 阅读 · 0 评论 -
python3使用builtwith识别网站使用相关技术
1. 首先通过pip install builtwith安装builtwith [plain] view plain copy print? C:\Users\Administrator>pip install builtwith Collecting builtwith Downloading builtwith-1.3.2.tar.gz转载 2017-07-07 23:02:42 · 537 阅读 · 0 评论 -
Python遍历文件夹和读写文件的方法
原 http://www.cnblogs.com/jackchiang/p/4605327.html 需 求 分 析 1、读取指定目录下的所有文件 2、读取指定文件,输出文件内容 3、创建一个文件并保存到指定目录 实 现 过 程 Python写代码简洁高效,实现以上功能仅用了40行左右的代码~ 昨天用Java写了一个写入、创建、复制、重命名文件要将近60行代码;转载 2017-07-09 10:23:36 · 4678 阅读 · 0 评论 -
爬虫 headers 中 Content-Type:json
若 headers 中 Content-Type:json..... data = { "name":"******" ,"password":"******" } requests.get(url,json=data) 直接对这个参数赋值原创 2017-08-11 11:21:12 · 1157 阅读 · 2 评论
分享