- 博客(31)
- 收藏
- 关注
原创 docker容器安装mysql
下载指定版本的mysql: sudo docker pull mysql:5.7。根据关键字搜索镜像: sudo docker search mysql。停止正在运行的容器:sudo docker stop 容器编号。删除正在运行的容器:sudo docker rm 容器编号。-d mysql:5.7 : 后台运行mysql5.7。查看正在运行的容器:sudo docker ps -a。--name mysql: 运行服务的取名。-v是将主机目录下的文件挂载到容器中路径下。
2024-05-24 21:59:01
834
原创 spark实验求TOP值
已知存在两个文本文件,file1.txt和file2.txt,内容分别如下:file1.txtfile2.txt以上两个文件所存储的数据字段的意义为:orderid, userid, payment, productid。
2024-04-24 19:02:34
1582
原创 spark3.0.0单机模式安装
添加以下内容,/bigdata/hadoop就是hadoop的路径,可根据自己的实际情况修改。下载spark3.0.0版本,hadoop和spark版本要对应,否则会不兼容。用xftp上传Linux虚拟机,上传目录/bigdata(可修改)注:此安装教程基于hadoop3集群版本。这是一个求Π的示例程序,输出如下。打开spark shell终端。修改spark配置文件。
2024-04-24 14:35:40
741
1
原创 蓝桥杯-求阶乘-python
不难看出,5的个数是最后一个数除以5的商(直至不够除5,因为有些数包括多个5,例如25,包含了两个5)在求阶乘的过程中,只要是偶数就会有2,而5相对2更少,所以对于10的数量我们可以用计算5的数量来代替。1-5,1-10,1-15,1-20,1-25,分别有1,2,3,4,5+1个5。对于非5倍数,我们考虑最接近该数的小于他的5的倍数,换一个说法,但是二分法查找的不仅仅是5的倍数,因此我们要考虑非5的倍数。末尾的0是由10产生的,而10是由质数2和5产生的。因为要求的N要求最小,即N一定是5的倍数。
2024-02-04 14:07:25
565
原创 蓝桥杯-“山”形数字个数(python版)
例如:12221,取前两位12,奇数位的数有12221、12321、12421、12521、12621、12721、12821、12921,【2~9,即9-2+1个,加1是因为2本身也是可以满足条件的】即有。对于区间[2022,2022222022]中的数,我们只需要考虑到区间[2222,199999991],所以对半区间是。这段代码只考虑了山形数的位数是偶数的情况,例如2332,56788765,而没有12321这种。对于回文,因为是对称的(类似照镜子),所以我们只需要对一半数字考虑单调性。
2024-02-03 21:54:59
610
1
原创 利用不同工具实现网络爬虫
BS4)是Python的一个第三方库,用来从HTML和XML中提取数据。在某些方面比XPath易懂,但是不如XPath简洁,而且由于它是使用Python开发的,因此速度比XPath慢。安装。
2024-01-07 20:27:49
1383
原创 python简单爬虫
的多进程库,用来处理与多进程相关的操作。但是由于进程与进程之间不能直接共享内存和堆栈资源,而且启动新的进程开销也比线程大得多,因此使用多线程来爬取比使用多进程有更多的优势。post提交的数据在请求体中,因此不能直接通过拼接url的形式访问网页资源。方法,可以让线程池里面的所有线程都“同时”执行一个函数。post提交的数据要借助data或json参数。类,它用来实现线程池。
2024-01-01 17:09:45
933
原创 在Python中使用正则表达式
数据在实际开发中是从各种平台爬取获得,爬取的数据可以直接进行正则表达式过滤,也可先保存到文本文件中再做处理。re.S忽略换行符,一般情况下只会匹配到字符串结尾或换行符前面,加上re.S参数后即可匹配换行符后面的内容。的时候,才会把正则表达式里面的括号中的结果打印出来。只返回第一个匹配到的结果,只要开头没有匹配上就结束匹配。根据正则表达式的写法,设计所需要的匹配规则。2个括号中的内容,以此类推。括号的情况下)的形式展示。获取第一个匹配上的字符串。个括号中的内容,参数为。获取所有匹配的字符串。
2023-12-31 16:57:01
485
原创 python读写文件操作
这里有一个参数“encoding”,它可以在打开文件的时候将文件转换为UTF-8编码格式,从而避免乱码的出现。如果文件是在Windows中创建的,并且使用UTF-8打开文件出现了乱码,可以把编码格式改为GBK。CSV文件本质上是文本文件,所以操作csv文件需要先以文本文件方式打开,再将文件对象传递给CSV模块。写列表的时候,Python写到文本中的文字是不会自动换行的,需要人工输入换行符才可以。参数为一个列表,把列表里面的所有字符串写入到文本中。准备字典类型的数据,包含字典的列表也可以。
2023-12-31 16:54:48
532
原创 正则表达式
我的微博密码是:1234567,QQ密码是:33445566, 银行卡密码是:888888,Github密码是:999abc999,帮我记住它们。: 假设我们要匹配包含"apple"的单词,但只有在"apple"后面不跟着"pie"的情况下才匹配。“1234567,QQ密码是:33445566, 银行卡密码是:888888,Github密码是:999abc999” (长度。:apple(第二个"apple"匹配成功,因为它后面不跟着"pie")
2023-12-31 15:24:50
388
原创 蓝桥每日一题--修剪灌木
而回去的方向有两种,向左和向右,我们只需计算这个灌木距离左边端点和右边端点的距离,取长的一个,因为是往返,再乘以2即可得出最远距离,这个即为每个灌木可以长到的最高高度。爱丽丝修剪灌木的顺序是从最左侧的灌木开始,每天向右修剪一棵灌木。当修剪了最右侧的灌木后,她。某灌木长到的最高高度可以看作爱丽丝回到这个灌木的距离(爱丽丝的速度和数生长的速度一致),,下一天开始向左修剪灌木。直到修剪了最左的灌木后再次调转方向。输出N行,每行一个整数,第1行表示从左到右第i棵树最高能长到多高。爱丽丝要完成一项修剪灌木的工作。
2023-12-25 13:51:29
424
1
原创 第五届计挑Java决赛真题之求三角形面积
参加比赛,遇到一到计算三角形面积的题,大概是这样,没截图给出直角坐标系第一象限中的不重复的n个点,在这n个点中选取三个点,求这三个点能组成的三角形的最大面积思路是直接暴力求解,遍历所有点,三次方的时间复杂度接下来就是求面积,最重要的应该是会求面积感觉这题就是考数学知识的,梦回高中。
2023-12-22 00:15:41
439
原创 python第四届蓝桥省赛--幸运数
这时,3为第2个幸运数,然后把所有能被3整除的序号位置的数删去。数组的大小:对于1~n之间的幸运数个数,我们只需要求n以内的幸运数,所以nums = [i for i in range(1,n)],这里不包括n。取m~n之间的幸运数:只需求1~n之间的幸运数,再取其中大于m且小于n的幸运数即可。对于其他幸运数,往后每一个数的下标+1对幸运数取余,余数为0则删除。直接用模拟,先求1~n之间的幸运数,最后取m~n之间的幸运数。第一个幸运数需要特殊处理,第一个幸运数为1,但基准序号为2。1 就是第一个幸运数。
2023-12-16 23:59:42
524
1
原创 python第五届蓝桥省赛--蚂蚁感冒
接着的一行是n个用空格分开的整数 Xi (-100 < Xi < 100), Xi的绝对值,表示蚂蚁离开杆子左边端点的距离。正值表示头朝右,负值表示头朝左,数据中不会出现0值,也不会出现两只蚂蚁占用同一位置。并且在和其它蚂蚁碰面时,会把感冒传染给碰到的蚂蚁。其实蚂蚁掉不掉头都无所谓,因为速度相等,感冒后的蚂蚁相遇,两只蚂蚁都感冒了,原本感冒的蚂蚁 转向后 可以看作 被传染的蚂蚁转向,然后继续按原方向前进。请你计算,当所有蚂蚁都爬离杆子时,有多少只蚂蚁患上了感冒。第二种情况:感冒蚂蚁传染了往右走的蚂蚁。
2023-12-16 13:30:58
658
1
原创 python第十二届蓝桥省赛真题--砝码称重
在这个问题中,我们需要找到所有可能的重量状态,因此广度优先搜索算法可以确保在最短步数内找到所有可能的状态,从而得到问题的解。因此,这个问题可以使用广度优先搜索算法来逐步计算可以称出的不同重量的数量,确保在最短步数内找到所有可能的重量状态,从而得到问题的解。在题目中要求的是不同重量,但存在不同砝码组合组成相同重量,这时我们可以用集合存储可以称出的重量,以免重复计数。另外,这个问题中我们需要找出可以称出的不同重量的数量,而广度优先搜索算法适用于需要找到。我们需要逐步考虑每个砝码的重量,然后计算在。
2023-12-13 22:30:32
529
1
原创 蓝桥杯第十三届JavaB组省赛真题-最少刷题数
小蓝老师教的编程课有 N 名学生,编号依次是 1 . . . N。第 i 号学生这学期刷题的数量是 Ai。对于每一名学生,请你计算他至少还要再刷多少道题,才能使得全班刷题比他多的学生数不超过刷题比他少的学生数。输出 N 个整数,依次表示第 1 . . . N 号学生分别至少还要再刷多少道题。第二行包含 N 个整数:A1, A2, A3, . . . , AN.(注意临界点,当当前学生刷题数为0时需特殊处理)第一行包含一个正整数 N。求出每个刷题数阶段的人数,可以用暴力,但是在寻找。
2023-11-06 12:19:36
375
原创 蓝桥杯第十三届省赛Java大学B组模拟--字符统计
给定一个只包含大写字母的字符串 S,请你输出其中出现次数最多的字母。如果有多个字母均出现了最多次,按字母表顺序依次输出所有这些字母。一个只包含大写字母的字符串 S .样例输入:BABBACAC。若干个大写字母,代表答案。
2023-11-04 22:43:25
141
2
原创 轻松理解Java序列化 反序列化、反射、动态代理、注解
Target 注解作用域(类、方法...)@Retention 注解有效时间范围@Target()public @interface 注解名称{public 属性名称 属性名() default 默认值;
2023-10-20 22:44:09
294
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人