- 博客(39)
- 收藏
- 关注
原创 Python爬虫实战:爬取贝壳网二手房成交数据,将数据存入Excel。
【代码】Python爬虫实战:爬取贝壳网二手房成交数据,将数据存入Excel。
2024-06-14 11:43:45
1878
原创 Python—遇到的问题,使用PyPDF2转化pdf时候遇到的各种问题。
【代码】Python—遇到的问题,使用PyPDF2转化pdf时候遇到的各种问题。
2023-01-04 11:43:26
14588
15
原创 Python—Locust 设置断言,巧遇请求都是200的情况,使用断言来操作。
python——locust测试遇到所有请求都是200的情况,只能使用断言来操作。
2022-12-08 15:29:06
675
原创 Python——使用自动化模块进行滑动验证,ichrome持续更新的一个包。
【代码】Python——使用自动化模块进行滑动验证,ichrome持续更新的一个包。
2022-11-15 14:59:13
1077
原创 Python调用,爬虫JS混淆——数据加密获取步骤和方法
在这里插入图片描述](https://img-blog.csdnimg.cn/0f938ff52b4a43688e8f23c1b157eee1.png。
2022-11-08 17:50:30
16521
3
原创 Python调用,爬虫JS逆向——ajax类型数据,数据加密获取步骤和方法(二)
【代码】Python调用,JS逆向——ajax类型数据,数据加密获取步骤和方法(二)
2022-11-08 15:02:07
1533
2
原创 Python——selenium+pyautogui,跳过网站对自动化采集的检测。
【代码】Python基础之pyautogui模块,跳过网站对自动化采集的检测。
2022-10-11 09:20:57
1773
原创 python自动化操作, 三种方法解决滑动模块问题(后二种可跳过90%滑动,限制需要打开浏览器)
【代码】python自动化操作,selenium + win32api + pyautogui 三种方法解决滑动模块问题(后二种可用)
2022-09-20 17:39:51
2569
原创 csdn博主文章存入本地
import reimport requestsfrom lxml import etreeimport osheaders = { 'User-Agent': 'Mozilla/5.0 (Linux; Android 8.0.0; Pixel 2 XL Build/OPD1.170816.004) AppleWebKit/537.36 (KHTML, ' 'like Gecko) Chrome/91.0.4472.114 Mobile Safari/5
2022-05-19 15:33:21
141
原创 Git部分命令-持续更新,遇到的一些git问题和解决方法。
1、未使用 git add 缓存代码,需要放弃本地修改2、已使用git add 缓存代码,需要先放弃缓存3、已经commit了代码的情况4、进入.git目录5、输入局部配置信息6、全局配置7、查看8、服务器修改密码9、服务器更新代码
2022-04-14 09:35:30
317
原创 python请求库:requests模块,遇到问题和解决方法。-持续更新
python请求库:requests模块,遇到问题和解决方法。-持续更新
2022-04-06 11:42:32
1149
原创 Python 时间模块:datetime和time获取当前时间的方法,获取前一日时间方法。
文章目录一、获取时间的两种方式1.datetime2.time二、获取昨天时间1.datetime-昨日或前几天2.time-昨日或前几天一、获取时间的两种方式import datetimeimport timetime_a = datetime.datetime.now()print("time_a:",time_a)time_b = time.localtime(time.time())print("time_b:",time_b)输出结果:time_a: 2022-02-0
2022-02-10 09:29:48
2841
2
原创 python实战:片段格式文件,进行合成存储。
文章目录一、步骤代码1、访问网站2、文件是否存在3、文件存储二、代码整合一、步骤代码1、访问网站提示:一定要带上user-agen。2、文件是否存在提示:判断相同名字的文件删除,不然后期会出现报错。 if os.path.exists(outfile_name): os.remove(outfile_name)3、文件存储提示:进行时,记得入口链接补全。link_content = requests.get(url_ts, headers=headers, .
2022-01-29 21:29:00
740
原创 Python爬虫实战:爬取贝壳网二手房成交数据,将数据存入Excel。
import requestsimport xlrd as xlrdfrom xlutils.copy import copyfrom lxml import etreedef getData(): b = '枫丹丽城','锦泉源','金色阳光家园','奥林园','美域盛景','富士庄园','润泽园','骏腾名苑','泉水友好园','泉水人家幸福里','泉水家年华','龙畔金泉三期','龙畔金泉二期','龙畔金泉一期','龙畔金泉四期','龙畔金泉五期K1区','泉水N3区','泉水N1区
2022-01-13 23:38:18
5354
21
原创 python 基础:定时开启操作和后台运行方法
Windows:pythonnw命令Python安装目录中,大家会发现目录中有python.exe和pythonw.exe两个可执行文件。python.exe在运行程序的时候,会弹出一个黑色的控制台窗口(也叫命令行窗口、DOS/CMD窗口)pythonw.exe是无窗口的Python可执行程序,意思是在运行程序的时候,没有窗口,代码在后台执行1.pythonw test.py后台使用Python运行test.py文件,无日志输出。2.pythonw test.py > test
2021-12-31 14:14:04
1246
原创 Python——常用一些函数和使用方法。
字符串:strstr [:::] 切片strip()去空格replace (原,需要替换) 替换split()切割,字符串变列表join()拼接,列表变字符串 startswith()判断指定开头endwith()判读指定结尾len()计算长度列表 :listlist [:::] 切片 与字符串相同append()追加操作remove()删除某个元素pop()默认最后一个删除for i in list:range()前闭后开镶嵌格式需要层级查
2021-11-10 15:46:15
617
原创 2021-11-07豆瓣抓取
import requestsimport time#找到urlurl = "https://movie.douban.com/j/chart/top_list"#构建请求头headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36"}for a in.
2021-11-07 15:40:44
228
原创 解析百度,将解析好的数据保存本地。
导包from urllib.request import urlopen#找到urlurl = 'http://www.baidu.com'#响应urlresponse = openurl(url)#得到响应内容res = response.read()#将响应内容进行编码resp = res.decode("urt-8")#保存本地with open("mybd.html",mode='w')as f: f.write(resp)print('okok')...
2021-11-06 11:05:31
138
原创 python 实战 traceback.format_exc和status_code解析球探
traceback.format_exc 的使用 可以调试代码get请求可以使用 status_code 查看访问是否正常import requests,time,reimport pymysql,tracebackurl_time=time.strftime(’%Y%m%d%H%M%S’)#获取带有时间的urlurl = 'http://zq.win007.com/jsData/...
2019-07-02 20:13:54
1180
原创 python子线程解析豆瓣
from lxml import etreeimport requests, jsonfrom threading import Threadfrom time import timeclass Douban():# 构建请求头def __init__(self): self.headers = { 'User-Agent': 'Mozilla/5.0 (Win...
2019-07-02 19:54:51
152
原创 python爬取糗事百科
import requestsfrom lxml import etreefrom time import time,sleepheaders ={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.157 Safari/...
2019-06-28 20:52:47
111
空空如也
填写代理问题,不需要手动填账号密码
2022-11-03
js逆向,获取参数问题
2022-10-21
滑动验证js解密,无法使用自动化操作
2022-10-12
python+selenium+js 模拟长按滑动拖拽问题
2022-10-12
TA创建的收藏夹 TA关注的收藏夹
TA关注的人