
python
lyhsdy
HEELO,优快云
展开
-
python爬虫爬取天猫店铺商品数据
#!coding=utf-8import requestsimport reimport randomimport timeimport jsonfrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pdrequests.packages.urllib3.di...原创 2018-08-27 13:50:35 · 11687 阅读 · 2 评论 -
python 弹窗提示警告框MessageBox
需要安装pywin32模块,pip install pywin32 ##pip install pywin32import win32api,win32con##提醒OK消息框win32api.MessageBox(0, "这是一个测试提醒OK消息框", "提醒",win32con.MB_OK)##是否信息框win32api.MessageBox(0, "这是一个测试是否信息...原创 2018-11-17 17:01:48 · 27737 阅读 · 2 评论 -
python 爬虫 爬取网易严选全网商品价格评论数据
1.获取商品目录在Chrome浏览器开发者工具中,可以找到目录的JS地址:http://you.163.com/xhr/globalinfo//queryTop.json 得到商品数据 def get_categoryList(): url='http://you.163.com/xhr/globalinfo//queryTop.json' ...原创 2018-11-26 15:33:07 · 2889 阅读 · 2 评论 -
python爬虫爬取今日头条APP数据(无需破解as ,cp,_cp_signature参数)
#!coding=utf-8import requestsimport reimport jsonimport mathimport randomimport timefrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pdrequests.package...原创 2018-12-01 11:38:51 · 8906 阅读 · 8 评论 -
python 爬虫 爬取 小米有品 全网 商品数据
#!coding=utf-8import requestsimport reimport randomimport timeimport jsonfrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pdrequests.packages.urllib3.d...原创 2018-12-22 12:05:58 · 3358 阅读 · 0 评论 -
python 通过腾讯地图API获取全国关键词(楼盘/商场)位置信息
到腾讯地图API官网https://lbs.qq.com/index.html 申请一张账号,申请开发者密钥(Key):申请密钥。 以下为搜索全国万达的地理位置信息#!coding=utf-8import requestsimport reimport randomimport timeimport jsonfrom requests.packages.urllib3.e...原创 2018-12-18 10:19:47 · 3737 阅读 · 0 评论 -
python爬虫爬取前程无忧51job企业招聘信息
# -*- coding:utf-8 -*-import requestsimport reimport randomimport timeimport pandas as pdfrom bs4 import BeautifulSoupimport lxmlfrom requests.packages.urllib3.exceptions import InsecureRequ...原创 2019-01-07 14:40:36 · 3009 阅读 · 0 评论 -
python 爬取百度图片搜索结果图片
#coding=utf-8import reimport requestsfrom urllib import errorfrom bs4 import BeautifulSoupimport osnum = 0numPicture = 0file = ''List = []def Find(url): global List print('...原创 2019-01-08 10:55:21 · 1050 阅读 · 0 评论 -
python利用爬虫制作简单翻译软件
思路:通过抓取百度翻译的返回翻译结果。目标url:https://fanyi.baidu.com/sugimport requestsurl='https://fanyi.baidu.com/sug' ##请求url##请求头headers={ 'Host':'fanyi.baidu.com', 'Origin':'https://fanyi.baidu.com'...原创 2019-01-25 12:13:29 · 663 阅读 · 0 评论 -
python 实现批量修改文件名
#!coding=utf-8import sysimport osdef replace_filename(file_path, var1, var2): for root, dirs, files in os.walk(file_path): for file_name in files: if var1 in file_name: ...原创 2018-11-17 16:39:43 · 2321 阅读 · 0 评论 -
pyhton爬虫 爬取电商平台商品历史价格、最低价格(慢慢买网)
主要使用的库:requests:爬虫请求并获取源码re:使用正则表达式提取数据json:使用JSON提取数据pandas:使用pandans存储数据#!coding=utf-8import requestsimport osimport reimport jsonimport datetimeimport timeimport pandas as pd...原创 2018-11-10 10:23:11 · 14065 阅读 · 10 评论 -
一招解决python pip install 安装库失败
PIP是python强大的安装利器,但是我们经常遇到安装库失败的问题,以下本人觉得最有效的解决方法:1.打开 https://www.lfd.uci.edu/~gohlke/pythonlibs网站,2.搜索(CTRL+F)需要安装的库的名称,比如pandas3.找到对应自己系统的版本并下载,cp后面的数字时python的版本,如cp36代表python3.6版本,WIN后面的数...原创 2018-10-25 10:22:55 · 90043 阅读 · 20 评论 -
今日头条ajax技术内as ,cp,_cp_signature参数分析、破解及python爬取频道数据
相信很多人在爬今日头条的时候就遇到了一个难题,就是找到了消息头后,有3个加密的参数(as ,cp,_cp_signature),如下图:找到的请求URL是:https://www.toutiao.com/api/pc/feed/?max_behot_time=1535349295&category=__all__&utm_source=toutiao&widen...原创 2018-08-27 15:20:51 · 12170 阅读 · 58 评论 -
python建立IP代理池
#!coding=utf-8import requestsimport reimport pandas as pddef get_proxy(): """ 获取代理 """ # 获取xicidaili的高匿代理 ##proxy_info_list = [] # 抓取到的ip列表 ip_list=[] dk_list=[] ...原创 2018-08-27 15:54:23 · 2365 阅读 · 2 评论 -
python爬虫苏宁易购店铺商品数据爬取
苏宁易购店铺商品数据爬取#!coding=utf-8##苏宁易购店铺商品数据爬取import requestsimport reimport mathimport randomimport timefrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pd...原创 2018-08-24 15:04:41 · 6416 阅读 · 2 评论 -
python爬取京东店铺商品价格数据(已过期)
# -*- coding:utf-8 -*-import requestsimport reimport randomimport timeimport jsonfrom requests.packages.urllib3.exceptions import InsecureRequestWarningimport pandas as pdrequests.packages.ur...原创 2018-09-13 11:03:08 · 1694 阅读 · 0 评论 -
python爬虫 爬取淘宝搜索页面商品信息数据
主要使用的库:requests:爬虫请求并获取源码re:使用正则表达式提取数据json:使用JSON提取数据pandas:使用pandans存储数据以下是源代码:#!coding=utf-8import requestsimport reimport timeimport jsonfrom requests.packages.urllib3.except...原创 2018-10-11 16:37:03 · 10219 阅读 · 10 评论 -
python爬虫 爬取 豆瓣网 搜索结果 同城活动 数据
主要使用的库:requests:爬虫请求并获取源码re:使用正则表达式提取数据json:使用JSON提取数据pandas:使用pandans存储数据bs4:网页代码解析以下是源代码:#!coding=utf-8import requestsimport reimport jsonfrom requests.packages.urllib3.excep...原创 2018-10-07 11:37:43 · 1345 阅读 · 0 评论 -
python爬虫爬取京东店铺商品价格数据(更新版)
主要使用的库:requests:爬虫请求并获取源码re:使用正则表达式提取数据json:使用JSON提取数据pandas:使用pandans存储数据##sqlalchemy :备用方案,上传数据到mysql以下是源代码:# -*- coding:utf-8 -*-import requestsimport reimport randomimport t...原创 2018-10-17 09:41:42 · 15484 阅读 · 8 评论 -
python 爬取时光网电影票房数据
# -*- coding:UTF-8 -*-from bs4 import BeautifulSoupimport sysimport pandas as pdimport reimport requestsdef sgw(): s=requests.session() headers={ 'Accept':'*/*', 'Acce...原创 2019-01-16 10:57:35 · 3331 阅读 · 0 评论