自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 PAT乙级刷题笔记和规则整理(python实现)(持续更新中~)

本文用于记录PAT乙级刷题过程中的一些笔记,包括但不限于:卡了好久终于找到的bug,绕了远路写了一大段其实完全可以用一个函数代替,以及看了别人的代码后醍醐灌顶的知识点,方便后续回顾避坑,也希望能对你有所帮助~同时整个题库刷下来,有一些题意完全可以当作“八股文”,整理在规则里,相当于一个“八股文”模板,之后再看到题目有类似要求,直接套用模板代码即可。笔记:遇到需要排序或者比大小的题,直接调用python的sort()方法即可:规则:输入方式:list(map(int, input().spli

2022-03-22 12:26:36 667

原创 PAT乙级合集——python实现(持续更新中~)

最近在巩固python编程能力,本文用于记录python实现的PAT乙级刷题索引,以及在刷题过程中总结的一些规则和经验~刷题建议:PAT乙级都是些简单的题目,如果是刷题的同学可以直接按照题号顺序刷即可~刷题笔记和规则整理:合集:乙级编号标题PAT 1001害死人不偿命的(3n+1)猜想(15分)PAT 1002写出这个数 (20分)PAT 1003我要通过!(20分)PAT 1004成绩排名 (20分)PAT 1005继续(3n+1)猜想(25分

2022-03-22 12:05:47 1021

原创 selenium添加代理(有账号密码)

1,导入Proxy库来添加capabilities属性:可以访问网站,但ip还是本机ip。

2024-04-10 15:49:07 4160 3

原创 接口校验流程

第二步:通过路径在XHR断点中进行校验:赋值路径/front/search/category,在网页点击source(源代码),右侧找到XHR/fetch Breakpoints(XHR/提取断点)点击添加路径,然后重新刷新网页。直到看到关键字路径/front/search/category,然后点击requestHeaders查看请求头校验,同时可以看到options中data格式为字符串格式,所以不能直接data不能写为常用的json格式。将验证字段添加到请求头中。

2023-03-17 23:31:17 568

原创 安装demjson时报错 error in demjson setup command: use_2to3 is invalid

查询之后发现是 demjson 2.2.4 兼容python2和python3,当安装环境为python3时,有一部分代码需要转换,Setuptools从版本58.0.0开始不再支持2to3的builds,所以导致 demjson 2.2.4安装后不再可用,今天在pip install demjson时报了以下错误:error in demjson setup command: use_2to3 is invalid。

2022-09-07 16:00:23 5752 6

原创 Appium1.22.3下载安装与配置

第一步,下载Appium-Server-GUI:下载地址:https://github.com/appium/appium-desktop/releases下载到本地后,在运行Appium Server GUI之前,需要先确保已配置好java环境和andriod sdk(主要是JAVA_HOME和ANDROID_HOME),由于笔者提前配置好了,这里不做赘述,未安装的同学需要安装配置完毕再回到这一步。点击Appium Server GUI.exe运行,点击点击Edit Configuration

2022-07-13 16:57:26 9477 9

原创 Fiddler下载安装及手机APP抓包设置

由于需要用到APP数据抓包分析,所以本文记录下Fiddler下载安装的流程,以及如果在手机设置代理,成功在fiddler访问手机APP数据。第一步,下载Fiddler:Fiddler官网链接:https://www.telerik.com/fiddler,点击【try for free】→【Fiddler Classic】:填写以下三个信息(一和三可以随便选择一项),然后点击【download for windoes】下载到本地,之后点击FiddlerSetup一步步点击Next安装(同其他安装软

2022-07-06 18:41:52 7051 3

转载 python中__init__函数的作用

在创建类的时候往往会用到__init__函数 这一类两边带有下划线的函数往往是私有函数,只能在该类的内部使用。init 的本意就是初始化的意思,一般出现在程序创建类中的第一个函数 。例如:其实也可以不用初始化。比如:这样的话,我们初始化的类中也会有一个name参数,但这个参数已经固定了赋值为“red”如果我们运用__init__函数,则声明了一个可以动态变化的参数name 例如:结果就是"red2" ,当然,你也可以传递不同的参数。我的理解就是__init__函数在创建类的开始,初始化一些参数,给

2022-06-21 11:02:58 12778 1

原创 电脑鼠标箭头一直转圈的解决办法

不同电脑导致鼠标箭头一直转圈的程序不一样,一定要学会在任务管理器里面找到PID反复乱跳的程序,结束任务即可恢复正常,不要再随便win+R禁用不知名服务啦

2022-06-20 12:14:32 24256 8

原创 python图片切割以及识别图片中的文字

在爬取网站https://verbalearn.com/game-tri-tue/dap-an-duoi-hinh-bat-chu/时,需要按如下需求爬取图片和答案:本次爬取数据量不大,爬取内容也都集中在一个页面,网站也没有异步加载或反爬措施,但是遇到了三个难点:难点一:图片链接是lazyload,且全部151条图片链接,分散在两个模块下,第一个模块’//div[@class=“entry-content”]/figure/img’的43条图片链接数据爬取顺利,第二个模块’//div[@class=“

2022-05-27 18:14:00 2485

转载 pinterest images scrape(selenium实现)

今天记录海外图片素材网站Pinterest的图片爬取初步分析:网站是动态渲染网站,每往下滑动,刷新出来新的页面;通过观察刷新后的网页,初步定位每页的请求url是https://www.pinterest.com/resource/BaseSearchResource/get/,可以看到这是一个POST请求,之后分析Preview和Response可以确定该url里面的确有我们要的数据:但是该POST请求有两个加密参数:source_url和data;经对比后,发现每页数据的source_url是相同的

2022-05-23 09:33:42 1254

原创 selenium+文件读取写入操作练习+1

今天记录从excel表中读取成语,输入网站查询,获取成语的常用程度,并写入excel中;(之前的方式是直接从谷歌搜索结论数,但是谷歌的人机校验实在不好绕过,且时间成本很高,所以换了个直接有成语常用度数据的网站,选对合适的网站就简单得很)。完整代码及分析如下:# from selenium import webdriver# from selenium.webdriver.common.by import By# from selenium.webdriver.common.keys import K

2022-05-19 09:55:59 422

转载 js逆向分析---analysis参数分析

analysis参数是js加密之后的,需要对原代码进行逆向分析才能解密爬取。js逆向分析的学习,参考B站关于music评论爬取的视频(https://www.bilibili.com/video/BV1Mf4y1s7ds?p=42),七麦网的分析,参考博客https://blog.youkuaiyun.com/weixin_43582101/article/details/122456609这里以music评论为例记录下js逆向分析的流程。

2022-05-17 13:40:42 836

原创 爬取图片文件时 Lazy Load(图片延迟加载)的处理(xpath定位方式)

注意:以后再遇到图片lazyload问题,先从找到真正属性入手,不要被加密和混淆绕远:如果控制台的elements里面看不到真正属性,那就右键从网页源代码里面找图片链接对应的真正属性! 在爬取脑筋猜词画迷题库的时候,爬取到的图片没有正常显示网页src后面对应的链接,而是显示’',如下图所示:原因是src对应的链接,设置了lazyloaded(延迟加载),所以不应用

2022-05-17 11:51:39 2820 3

原创 python+selenium从excel读取成语到谷歌搜索得到搜索结论数

今天记录利用selenium从excel中读取内容,将内容输入到谷歌浏览器中,并搜索得到结论数,然后再将结论数写入excel中的案例。思路:1,利用selenium模拟用户操作浏览器,由于是繁体成语,且是在谷歌浏览器中进行搜索,先开启代理,然后将谷歌浏览器默认语言设置为中文繁体(设置->高级->语言),同时在谷歌浏览器的主页,还要将浏览器页面的展示设置为繁体;2,设置完之后,关闭Chrome浏览器,进入电脑C:\Users\AppData\Local\Google\Chrome路径下,

2022-05-09 18:39:27 942

原创 强迫症去掉‘Backend QtAgg is interactive backend. Turning interactive mode on.’提示

在使用PyCharm时,不知是导入了matplotlib还是导入pyqt5模块,即使没有用到这两个模块,也总是提示‘Backend QtAgg is interactive backend. Turning interactive mode on.’:强迫症实在受不了,网上搜了几种方法,前几种方法(包括修改settings,将Enable interactive mode选项选中和增加以下代码的方式)都无效,遂将最终有效的方法记录在这里。import matplotlib.pyplot as plt

2022-05-05 18:37:44 12416 3

原创 xpath-通过列表推导式和string(.)的方式获取标签下包含子标签的所有文本

如图,需要得到出处文本内容,如果只是"./p[4]/text()"匹配,则会漏掉/a下面的“起坐”和“桃笙”:改为列表推导式和string(.)的方式返回/p下面的所有子节点文本:chuchu = result.xpath("./p[4]") for a in chuchu: origin = [i.xpath('string(.)') for i in a.xpath('.')] print('origin:',origin[0][3:]) # 再通过[3:]切割去掉“出处

2022-04-28 14:54:17 862

原创 PAT乙级 1022 D进制的A+B (python)

1022 D进制的A+B (20 分)输入两个非负 10 进制整数 A 和 B (≤230 −1),输出 A+B 的 D (1<D≤10)进制数。输入格式:输入在一行中依次给出 3 个整数 A、B 和 D。输出格式:输出 A+B 的 D 进制数。输入样例:123 456 8输出样例:1103python代码(部分正确,得分18分):s = list(map(int,input().split()))A,B,D= s[0],s[1],s[2]C = int(A + B)

2022-04-15 19:36:13 1455

原创 PAT乙级 1017 A除以B (python)

1017 A除以B (20 分)本题要求计算 A/B,其中 A 是不超过 1000 位的正整数,B 是 1 位正整数。你需要输出商数 Q 和余数 R,使得 A=B×Q+R 成立。输入格式:输入在一行中依次给出 A 和 B,中间以 1 空格分隔。输出格式:在一行中依次输出 Q 和 R,中间以 1 空格分隔。输入样例:123456789050987654321 7输出样例:17636684150141093474 3python代码:s = list(map(int,input().spl

2022-04-13 18:45:13 542

原创 PAT乙级 1014 福尔摩斯的约会 (python)

1014 福尔摩斯的约会 (20 分)大侦探福尔摩斯接到一张奇怪的字条:我们约会吧!3485djDkxh4hhGE2984akDfkkkkggEdsbs&hgsfdkd&Hyscvnm大侦探很快就明白了,字条上奇怪的乱码实际上就是约会的时间星期四 14:04,因为前面两字符串中第 1 对相同的大写英文字母(大小写有区分)是第 4 个字母 D,代表星期四;第 2 对相同的字符是 E ,那是第 5 个英文字母,代表一天里的第 14 个钟头(于是一天的 0 点到 23 点由数字

2022-04-13 17:23:52 347

原创 PAT乙级 1013 数素数 (python)

1013 数素数 (20 分)令 Pi表示第 i 个素数。现任给两个正整数 M≤N≤104,请输出 PM 到 PN 的所有素数。输入格式:输入在一行中给出 M 和 N,其间以空格分隔。输出格式:输出从 PM 到 PN 的所有素数,每 10 个数字占 1 行,其间以空格分隔,但行末不得有多余空格。输入样例:5 27输出样例:11 13 17 19 23 29 31 37 41 4347 53 59 61 67 71 73 79 83 8997 101 103python代码:

2022-04-12 18:34:23 566

原创 PAT乙级 1012 数字分类 (python)

1012 数字分类 (20 分)给定一系列正整数,请按要求对数字进行分类,并输出以下 5 个数字:A1= 能被 5 整除的数字中所有偶数的和;A2= 将被 5 除后余 1 的数字按给出顺序进行交错求和,即计算 n1−n2+n3−n4⋯;A3= 被 5 除后余 2 的数字的个数;A4= 被 5 除后余 3的数字的平均数,精确到小数点后 1 位;A5= 被 5 除后余 4 的数字中最大数字。输入格式:每个输入包含 1 个测试用例。每个测试用例先给出一个不超过 1000 的正整数 N,随后给出

2022-04-12 16:25:44 376

转载 列表生成式+过滤器(filter)+映射(map)+lambda总结

列表生成式+过滤器(filter)+映射(map)+lambda总结这些都是python的特色,不仅强大,而且好用,配合起来使用更是无敌。lambdalambda用于产生一个匿名表达式,组成部分为:lambda + ‘函数表达式’ ‘函数表达式’由一个冒号加上两个‘操作数’组成,如:lambda x:x*3冒号左边的操作数,作为函数的参数;冒号右边的作为函数的放回值!那么lambda x:x*3就等价于:def func(x):   return x*3列表生成式列表生成器

2022-04-12 11:34:07 782

原创 PAT乙级 1016 部分A+B (python)

1016 部分A+B (15 分)正整数 A 的“DA(为 1 位整数)部分”定义为由 A 中所有 DA组成的新整数 PA。例如:给定 A=3862767,DA=6,则 A 的“6 部分”PA是 66,因为 A 中有 2 个 6。现给定 A、DA 、B、DB ,请编写程序计算 PA +PB。输入格式:输入在一行中依次给出 A、DA B、 DB ,中间以空格分隔,其中 0<A,B<109 。输出格式:在一行中输出 PA+PB的值。输入样例 1:3862767 6 1353029

2022-03-27 23:57:47 598

原创 PAT乙级 1011 A+B 和 C (python)

1011 A+B 和 C (15 分)给定区间 [−231 ,231 ] 内的 3 个整数 A、B 和 C,请判断 A+B 是否大于 C。输入格式:输入第 1 行给出正整数 T (≤10),是测试用例的个数。随后给出 T 组测试用例,每组占一行,顺序给出 A、B 和 C。整数间以空格分隔。输出格式:对每组测试用例,在一行中输出 Case #X: true 如果 A+B>C,否则输出 Case #X: false,其中 X 是测试用例的编号(从 1 开始)。输入样例:41 2 32

2022-03-24 20:17:01 1897

原创 PAT乙级 1010 一元多项式求导 (python)

1010 一元多项式求导 (25 分)设计函数求一元多项式的导数。(注:xn(n为整数)的一阶导数为nxn−1 。)输入格式:以指数递降方式输入多项式非零项系数和指数(绝对值均为不超过 1000 的整数)。数字间以空格分隔。输出格式:以与输入相同的格式输出导数多项式非零项的系数和指数。数字间以空格分隔,但结尾不能有多余空格。注意“零多项式”的指数和系数都是 0,但是表示为 0 0。输入样例:3 4 -5 2 6 1 -2 0输出样例:12 3 -10 1 6 0python代码:

2022-03-24 20:10:49 499

原创 PAT乙级 1009 说反话 (python)

1009 说反话 (20 分)给定一句英语,要求你编写程序,将句中所有单词的顺序颠倒输出。输入格式:测试输入包含一个测试用例,在一行内给出总长度不超过 80 的字符串。字符串由若干单词和若干空格组成,其中单词是由英文字母(大小写有区分)组成的字符串,单词之间用 1 个空格分开,输入保证句子末尾没有多余的空格。输出格式:每个测试用例的输出占一行,输出倒序后的句子。输入样例:Hello World Here I Come输出样例:Come I Here World Hellopyth

2022-03-24 20:03:55 962

原创 PAT乙级 1008 数组元素循环右移问题 (python)

1008 数组元素循环右移问题 (20 分)一个数组A中存有 N(>0)个整数,在不允许使用另外数组的前提下,将每个整数循环向右移M(≥0)个位置,即将A中的数据由(A~0~A~1~⋯A~N−1~)变换为(A~N−M~⋯A~N−1~A~0~A~1~⋯A~N−M−1~)(最后M个数循环移至最前面的M个位置)。如果需要考虑程序移动数据的次数尽量少,要如何设计移动的方法?

2022-03-24 19:59:50 957

原创 PAT乙级 1007 素数对猜想 (python)

1007 素数对猜想 (20 分)让我们定义d n为:d n =p n+1−p n ,其中p i是第i个素数。显然有d 1 =1,且对于n>1有d n​是偶数。“素数对猜想”认为“存在无穷多对相邻且差为2的素数”。现给定任意正整数N(<10^5\ ),请计算不超过N的满足猜想的素数对的个数。输入格式:输入在一行给出正整数N。输出格式:在一行中输出不超过N的满足猜想的素数对的个数。输入样例:20输出样例:4python代码:# 耗时177msimport mat

2022-03-23 14:08:09 686

原创 PAT乙级 1006 换个格式输出整数 (python)

1006 换个格式输出整数 (15 分)让我们用字母 B 来表示“百”、字母 S 表示“十”,用 12…n 来表示不为零的个位数字 n(<10),换个格式来输出任一个不超过 3 位的正整数。例如 234 应该被输出为 BBSSS1234,因为它有 2 个“百”、3 个“十”、以及个位的 4。输入格式:每个测试输入包含 1 个测试用例,给出正整数 n(<1000)。输出格式:每个测试用例的输出占一行,用规定的格式输出 n。输入样例 1:234输出样例 1:BBSSS1234

2022-03-23 13:09:00 225

原创 PAT乙级 1005 继续(3n+1)猜想 (python)

1005 继续(3n+1)猜想 (25 分)卡拉兹(Callatz)猜想已经在1001中给出了描述。在这个题目里,情况稍微有些复杂。当我们验证卡拉兹猜想的时候,为了避免重复计算,可以记录下递推过程中遇到的每一个数。例如对 n=3 进行验证的时候,我们需要计算 3、5、8、4、2、1,则当我们对 n=5、8、4、2 进行验证的时候,就可以直接判定卡拉兹猜想的真伪,而不需要重复计算,因为这 4 个数已经在验证3的时候遇到过了,我们称 5、8、4、2 是被 3“覆盖”的数。我们称一个数列中的某个数 n 为“关

2022-03-22 11:01:11 182

原创 Tesserocr 的安装及一些失败处理(windows环境)

Tesserocr 是 Python 的一个 OCR 识别库,但其实是对 Tesseract 做的一层 Python API 封装,所以它的核心是 Tesseract,所以在安装 Tesserocr 之前我们需要先安装 Tesseract,本文用来记录安装流程以及安装过程中遇到的一些问题和处理方式。第一步,下载 TesseractTesseract为 Tesserocr 提供了支持,下载链接为:http://digi.bib.uni-mannheim.de/tesseract/。这里我直接下载的最新版:

2022-03-21 16:11:23 5717 3

原创 PAT乙级 1004 成绩排名 (python)

1004 成绩排名 (20 分)读入 n(>0)名学生的姓名、学号、成绩,分别输出成绩最高和成绩最低学生的姓名和学号。输入格式:每个测试输入包含 1 个测试用例,格式为第 1 行:正整数 n第 2 行:第 1 个学生的姓名 学号 成绩第 3 行:第 2 个学生的姓名 学号 成绩… … …第 n+1 行:第 n 个学生的姓名 学号 成绩其中姓名和学号均为不超过 10 个字符的字符串,成绩为 0 到 100之间的一个整数,这里保证在一组测试用例中没有两个学生的成绩是相同的。输出格式

2022-03-19 16:02:48 793 2

原创 PAT乙级 1003 我要通过 (python)

1003 我要通过! (20 分)“答案正确”是自动判题系统给出的最令人欢喜的回复。本题属于 PAT 的“答案正确”大派送 —— 只要读入的字符串满足下列条件,系统就输出“答案正确”,否则输出“答案错误”。得到“答案正确”的条件是:字符串中必须仅有 P、 A、 T这三种字符,不可以包含其它字符;任意形如 xPATx 的字符串都可以获得“答案正确”,其中 x 或者是空字符串,或者是仅由字母 A 组成的字符串;如果 aPbTc 是正确的,那么 aPbATca 也是正确的,其中 a、 b、 c 均或者

2022-03-19 13:11:39 692

原创 PAT乙级 1002 写出这个数 (python)

PAT乙级 1002 写出这个数 (python实现)

2022-03-18 17:37:34 666

原创 PAT乙级 1001 害死人不偿命的(3n+1)猜想 (Python)

1001 害死人不偿命的(3n+1)猜想 (15 分)卡拉兹(Callatz)猜想:对任何一个正整数 n,如果它是偶数,那么把它砍掉一半;如果它是奇数,那么把 (3n+1) 砍掉一半。这样一直反复砍下去,最后一定在某一步得到 n=1。卡拉兹在 1950 年的世界数学家大会上公布了这个猜想,传说当时耶鲁大学师生齐动员,拼命想证明这个貌似很傻很天真的命题,结果闹得学生们无心学业,一心只证 (3n+1),以至于有人说这是一个阴谋,卡拉兹是在蓄意延缓美国数学界教学与科研的进展……我们今天的题目不是证明卡拉兹猜

2022-03-18 16:31:01 237

原创 easyocr快速安装及图片文字提取演示(小语种)

前几天工作中需要用到图片识别,由于从图片中提取的文字是小语种越南语,了解了几种图片识别库之后决定使用easyocr(支持80+种语言)来进行文字提取,easyocr的介绍可详见官网:https://github.com/JaidedAI/EasyOCR,想要使用该图片识别库的童鞋,可以先在demo(https://www.jaided.ai/easyocr/)上试验一下,看看自己的图片在demo上识别的准确度:一,easyocr安装:安装easyocr之前最好安装pytorch,笔者是windows

2022-03-18 15:57:05 9840 3

原创 PAT乙级 1029 旧键盘 (20 分) (Python)

PAT (Basic Level) 1029 旧键盘 (20 分)旧键盘上坏了几个键,于是在敲一段文字的时候,对应的字符就不会出现。现在给出应该输入的一段文字、以及实际被输入的文字,请你列出肯定坏掉的那些键。输入格式:输入在 2 行中分别给出应该输入的文字、以及实际被输入的文字。每段文字是不超过 80 个字符的串,由字母 A-Z(包括大、小写)、数字0-9、以及下划线 _(代表空格)组成。题目保证 2 个字符串均非空。输出格式:按照发现顺序,在一行中输出坏掉的键。其中英文字母只输出大写,

2022-03-18 11:56:38 247 1

原创 启动redis出错:creating server tcp listening socket 127.0.0.1:6379: bind No error

window下,在使用redis-server.exe redis.windows.conf命令启动redis服务时报错:creating server tcp listening socket 127.0.0.1:6379: bind No error解决方案:按顺序输入如下命令就可以连接成功redis-cli.exeshutdownexitredis-server.exe redis.windows.conf————————————————参考链接:https://blog.csdn.

2022-03-01 11:08:41 2317

原创 memset--对数组中每一个元素赋相同的值

memset–对数组中每一个元素赋相同的值使用memset需要在程序开头添加string.h头文件,且只建议初学者使用memset赋0或-1,因为memset使用的是按字节赋值,即对每个字节赋同样的值,这样组成int型的4个字节就会被赋成同样的值。而由于0的二进制补码为全0,-1的二进制为全1,不容易弄错。如果要对数组赋其他数字,则使用fill函数更好(但memset的执行速度块)...

2020-02-22 10:37:08 322

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除