爬虫
dwanwan16
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
selenium实例
selenium之定位知识 from selenium import webdriver import time #初始化一个浏览器对象 driver=webdriver.Chrome() driver.get('http://www.baidu.com') a=driver.find_element_by_id('kw') a.send_keys('selenium') driver.find_...原创 2020-03-02 14:07:56 · 323 阅读 · 0 评论 -
抓包之post请求
爬虫之有道翻译 post请求需要有请求头和表单数据 import requests import json word='我们都是追梦人' url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule' headers={'Accept':'application/json, text/javascript,...原创 2020-03-02 13:27:34 · 3583 阅读 · 0 评论 -
抓包之get请求
爬虫之淘宝抓包法 案例一(数据格式处理) import urllib.request #url = 'https://image.baidu.com/search/detail?ct=503316480&z=0&ipn=d&word=%E9%9F%A9%E5%95%86%E8%A8%80%E5%A3%81%E7%BA%B8&hs=2&pn=0&spn...原创 2020-03-02 11:21:22 · 2185 阅读 · 0 评论 -
爬取你所想的图片
数据在网页源代码中用正则 案例一 import urllib.request url = 'https://tieba.baidu.com/p/5734214281' response=urllib.request.urlopen(url) html=response.read() html=html.decode('utf-8') html 运行截图如下: import re reg=r's...原创 2020-03-02 10:31:34 · 478 阅读 · 0 评论
分享