- 博客(18)
- 收藏
- 关注
原创 蓝桥杯题目
(0,0)→(1,0)→(1,1)→(10,1)→(10,0)→(11,0),花费时间为1+1/0.7+:采用递归思想,时间等于前面到倒数第二个杆子的时间加上倒数第二个杆子到倒数第一个杆子的时间,依次类推。瞬间到达第i+1根竹竿的高度为b+1的位置(x+1,b+1),请计算蜗牛最少需要。送门(0
2024-09-13 21:53:46
474
原创 蓝桥杯题目
(x2,y2)依次是R1的左下角和右上角坐标,(x3,y3)和(x4,y4)依次是R2的左下。平面上有个两个矩形R1和R2,它们各边都与坐标轴平行。输入格式:包含八个数:x1,y1,x2,y2,x3,y3,x4,y4。注意:如果R,和R2有重叠区域,重叠区域的面积只计算一次。角和右上角坐标,请你计算R1和R2的总面积是多少?例如:输入:2 1 7 4 5 3 8 6。
2024-09-13 19:56:08
237
原创 数据结构与算法笔记
在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随着n的变化情况并确定T(n)的量级。算法的时间复杂度,就是算法的时间量度,记作:T(n)=O(fn)。它表示随着问题规模的增大,算法执行时间的增长率和f()的增长率相同,称作算法的渐近时间复杂度,简称时间复杂度,其中f(n)是问题规模的某个函数。
2024-09-03 15:55:23
1588
原创 代码打包为exe文件
用到python里面的一个模块查看我们这个项目安装哪些第三方库把安装的第三库的名字和版本全部写入一个txt文件里当要按照txt文件里的第三库名字时如果代码有报错,想看打包的exe哪里有问题,打开电脑终端,输入exe文件的路径就可以了。
2024-06-25 14:51:33
305
原创 c语言运算符
按位或操作使用 | 符号表示。对于两个二进制数,如果对应位上至少有一个是1,则结果的那个位也是1;如果两个对应位都是0,则结果的那个位是0。
2024-06-17 19:58:36
265
原创 爬虫 解决验证码问题
这次介绍selenium用超级鹰的工具来自动化处理验证码来完成登录。2.用网上一些处理验证码的工具,如超级鹰。3.用已登录好的cookie。1.利用图像处理技术。
2024-05-31 17:38:28
1349
原创 爬虫 selenium
selenium可以像人一样打开浏览器,可以从selenium中直接提取网页上的各种信息,有些网页的请求数据是加密的,碰到这种情况我们就可以用selenium模拟浏览器去请求这些数据,跳过解密步骤,用selenium来驱动浏览器来打开去发送请求,可以避免一些反爬机制与手段,在一些情况下,更加方便,缺点就是速度太慢了,每次打开都要很久若是碰到打开浏览器自动关闭的情况下,是selenium的版本太高导致的,把版本换低一点就可以了。
2024-05-30 23:02:54
808
原创 爬虫爬取电影,下载ts并合并ts实例
本次爬取电影内容有key加密,对ts文件进行了解密,并将ts文件合并成mp4视频。采用协程方式来爬取ts文件,大大提高了爬取的效率。代码如下:建议从下往上看。
2024-05-30 16:32:06
908
原创 爬虫 异步携程
爬虫中用异步协程进行爬取内容,可以大大的节省时间,效率也大大的提高,用异步协程方法爬取一部小说只需几秒时间就爬完了,其效率非常高,下面是几个用异步协程爬取内容的几个案例另一种写法。
2024-05-30 16:23:46
604
原创 xpath
xpath在爬虫里面解析html,由于xpath的语法非常简单,并且效率高,也非常受喜爱,在爬虫解析html中常用的三种方法:xpath、re正则表达、bs4模块,其中xpath也是当中效率最高的。下面是几个用xpath方法来解析html的例子。/表示层级关系,第一个/是根节点。
2024-05-30 16:22:48
152
原创 爬取博客园的文章并解决状态码为400问题且url不变
当我们切换页面时,url只有后面#的在变化,url后面#的内容并不能标记唯一的一个页面,也就是说 当我们切换页面时,他的url是不变的,这就是后台的异步操作,需要network进行抓包处理。当查看network的发起程序的aggsite.loadPostList来看后台数据的操作,发现数据是json。当程序的状态码是400时,意思是请求表单必须是json格式,所以我们把请求参数改为json格式就可以解决了。所以我们的参数需要转换成json格式。
2024-05-26 15:58:39
462
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人