
爬虫
huanghong6956
这个作者很懒,什么都没留下…
展开
-
深圳股票代码报告下载
import requestsimport mathdef post_data(stock,pageNum): headers={ "Accept": "application/json, text/javascript, */*; q=0.01", "Accept-Encoding": "gzip, deflate", "Accept-Language": "zh-CN,zh;q=0.9", "Connection": "keep-alive", "C.原创 2021-04-16 18:21:42 · 204 阅读 · 0 评论 -
js逆向调试工具,集成常用js加密函数,前端js几种加密集合 md5 SHA AES DES BASE64
下载链接https://download.youkuaiyun.com/download/huanghong6956/15637935原创 2021-03-08 10:47:19 · 268 阅读 · 0 评论 -
nth-child 改为 nth-of-type
nth-child 改为 nth-of-type原创 2021-01-06 16:07:41 · 137 阅读 · 0 评论 -
requests-html 全新爬虫包来袭
https://www.jianshu.com/p/bd828b9cf74d原创 2020-09-27 10:26:31 · 227 阅读 · 0 评论 -
python3之url编码互转
#先引入模块from urllib.request import quoteff = '摄像头'ff = quote(ff)print(ff)# 解码是另一个模块from urllib import parseaa = '%E6%91%84%E5%83%8F%E5%A4%B4'ret = parse.unquote(aa)print(ret)...原创 2019-12-05 15:28:09 · 326 阅读 · 0 评论 -
批量下载图片re,requests,os三大模块用法
import re,requests,os#头部模拟header={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}#计数n=1#写入def down(iters): glo...原创 2019-01-29 15:46:31 · 609 阅读 · 0 评论 -
批量下载音乐
import requests, ossonglistd = []header = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}url = 'url=https://...原创 2019-01-29 15:58:27 · 1645 阅读 · 0 评论 -
python《文件下载进度显示》 urllib.request.urlretrieve(self.__path,self.__name,jindu)
#coding=utf-8import threadingimport os,sysimport urllib.request as ur#显示调用函数def jindu(a,b,size): os.system('cls') per=100*a*b/size per=round(per, 2) if per>100: per=...原创 2019-01-29 16:04:15 · 519 阅读 · 0 评论 -
《xpath下载百度新闻链接》路径匹配 csv文件保存
#conding=utf-8from lxml import htmlimport requestsimport csvheader={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'...原创 2019-01-29 16:10:56 · 323 阅读 · 0 评论 -
初窥Scrapy
Scrapy库安装先离线安装Twisted-18.4.0-cp36-cp36m-win_amd64.whl先切换地址pip installTwisted-18.4.0-cp36-cp36m-win_amd64.whl然后安装1.5.0版本Scrapypip install Scrapy==1.5.0scrapydos下执行d:cd 定位到指定盘上...原创 2019-04-01 21:45:37 · 169 阅读 · 0 评论 -
python爬虫干货总结
阅读本文大概需要 好多 分钟。”昨天的时候我参加了掘金组织的一场 Python 网络爬虫主题的分享活动,主要以直播的形式分享了我从事网络爬虫相关研究以来的一些经验总结,整个直播从昨天下午 1 点一直持续到下午 5 点,整整四个小时。整个分享分为三个阶段,第一阶段先介绍了自己从大学以来从事编程开发以来的相关历程,第二阶段是正式的网络爬虫分享流程,详细总结了网络爬虫开发的一些要点,第三阶段...原创 2019-04-30 01:32:08 · 224 阅读 · 0 评论 -
mitmproxy安装
https://www.cnblogs.com/grandlulu/p/9525417.html本文是一个较为完整的mitmproxy教程,侧重于介绍如何开发拦截脚本,帮助读者能够快速得到一个自定义的代理工具。本文假设读者有基本的 python 知识,且已经安装好了一个python3 开发环境。如果你对nodejs的熟悉程度大于对 python,可移步到anyproxy...原创 2019-05-08 04:03:42 · 809 阅读 · 0 评论 -
queue队列 多线程 下载100页表情包
#encoding: utf-8import requests# 导入xpathfrom lxml import etreefrom urllib import requestimport os#导入正则表达式import refrom queue import Queueimport threadingclass Procuder(threading.Threa...原创 2019-06-02 11:49:01 · 235 阅读 · 0 评论