爬虫
Uridis
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
UA大全-user-agent大全
PC端:safari 5.1 – MACUser-Agent:Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50safari 5.1 – WindowsUser-Agent:Mozilla/5.0 (...转载 2019-01-20 01:15:34 · 14824 阅读 · 0 评论 -
xpath笔记
python爬虫--xpathxpath安装什么是xpath?常用的路径表达式chrome安装xpath插件启动和关闭插件属性定位层级定位索引定位逻辑定位模糊定位取文本取属性代码中使用xpathxpath安装pip install xpath什么是xpath?xml是用来存储和传输数据使用的和html的不通有两点:(1)html用来显示数据,xml是用来传输数据(2)html标签是...原创 2019-02-09 18:14:17 · 283 阅读 · 0 评论 -
代理的知识
转载 2019-02-09 18:17:08 · 250 阅读 · 0 评论 -
百度翻译Python-Post抓包使用代码
# coding=utf-8import urllib.requestimport urllib.parsepost_url = 'https://fanyi.baidu.com/v2transapi'# word = input('请输入您要搜索的单词:')# 'sign': '275695.55262',# 'token': '7f0ccf4952ab4548d8862aa40...原创 2019-02-09 18:21:58 · 1171 阅读 · 1 评论 -
模拟登陆人人网-Python-爬虫
# coding=utf-8import urllib.requestimport urllib.parseimport http.cookiejar# 真实的模拟浏览器,当发送完post请求的时候,将cookie保存到代码中# 创建一个cookiejar对象cj = http.cookiejar.CookieJar()# 通过cookiekar创建一个handlerhandl...原创 2019-02-09 18:29:34 · 461 阅读 · 0 评论 -
使用多线程爬虫爬取泛见网数据--www.fanjian.com
使用多线程爬虫爬取泛见网数据--www.fanjian.com使用多线程爬虫爬取泛见网数据--www.fanjian.com分析网页分析要注意的点完整代码使用多线程爬虫爬取泛见网数据–www.fanjian.com分析两类线程 :初定下载线程(3)、解析线程数量(3)内容队列(线程之间交互):下载线程往队列中put数据,解析线程从线程中get数据数据:url队列:下载线程从url队列...原创 2019-03-05 14:29:15 · 549 阅读 · 1 评论 -
chrome-headless
原创 2019-03-02 18:25:10 · 802 阅读 · 0 评论 -
抓取动态页面遇到的问题
请查看个人博客的《chrome-headless》文章,进行参考;原创 2019-03-02 18:27:23 · 510 阅读 · 0 评论
分享