自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Ceverymxt7的博客

记录了本人的学习历程与近来的研究方向/成果

  • 博客(42)
  • 收藏
  • 关注

原创 python爬虫入门——Selenium

 如果你的学习方向和我一样是大模型,在模型微调的过程中必然需要大量的数据,学会使用爬虫会非常有用。如果你是做电商的或是正在求职,那么学会使用爬虫也能帮助你快速找到你需要的信息。 亦或者你学习爬虫是有其他需求,我也希望这篇文章能帮助完成它。

2025-03-12 17:00:05 1869

原创 torch入门:音频分类任务(pytorch+librosa)

前面我们已经做过了一些文本分类任务,下面我们来试着完成一个音频分类任务吧。音频分类任务简单来说就是现在有若干个人说话时的音频数据,你需要使用这些数据来训练一个模型,能够分类好这些人的语音,当这些人当中的某人再次发言时,你的模型能够识别出是谁在说话。音频分类理论上来说完全可以用来分类歌曲,但是对于新手来说我建议您先从数据噪声较小的个人语音分类做起较好。

2025-03-10 21:19:25 1055

原创 大模型入门:文本分类任务(基于Bert进行微调)

在上一篇文章中我介绍了如何通过fasttext来对文本进行分类,然而fasttext的训练过程非常短,对算力的需求很低,且对于参数的要求比较模糊,所以可能有朋友对模型的训练与迭代还是没有一个清晰的理解,下面我们换一种方法来对同样的文本进行分类任务,应该能让你对模型训练与微调有更加清晰的理解。

2025-03-09 19:59:13 1364 1

原创 大模型入门:文本分类任务(基于fasttext与jieba)

        本人认为将文本分类任务作为大模型的入门任务来说是不错的,因为这类任务的目的明确,数据获取较简单,模型回馈的结果明显,是很好的起点。        而“情绪分类”则是文本分类任务中的经典,我们下面就基于python的fasttext库与jieba分词器来完成一个“情绪分类”的任务。

2025-03-04 13:27:34 1058

原创 笔记:一些关于LLM的概念

本人在学习大模型过程中留下的一些笔记,希望对你有入门LLM有帮助。

2025-03-03 11:07:15 682

原创 python 二维数组深搜

【代码】python 二维数组深搜。

2025-03-03 10:41:03 131

原创 python简单动态规划

小明最近沉迷于一个游戏。这个游戏的规则是,按顺序给出 N 个正整数。每次可以通过将两个相邻且相同的数字合并成比原来的大一的数(例如两个 3 可以合并成一个 4)。直到不能合成为止,请你设计一种方法求最大的数字。来源:https://trustie.educoder.net/problems/j7fe3mwvnpat/oj/eilbjwkm。第 2 到 N+1 行,每一行输入一个正整数,表示第 i 个数字的大小 a。第一行有一个整数 N,表示该序列的数字的个数。输出合并后序列最大的值。

2025-03-03 10:40:54 119

原创 python“简单背包问题“

现在小明所在的计算机学院正在面临一件大事,计算机学院将被分为计算机学院和软件学院。首先,学院对所有设施进行评估,如果两个设施的价值相同,则认为它们是相同的。现在学院请聪明的你帮忙计算下,如何划分设施,以使最后的计算机学院和软件学院的设施价值接近相同,同时计算机学院的设施价值不小于软件学院。针对输入,打印出两个整数 A 和 B,分别表示计算机学院和软件学院将获得的设施总价值。接下来输入 n 行,每行包含两个整数 v,m,分别表示该种类设施的价值和数量。第一行有一个整数 n,表示不同种类设施的数量;

2025-03-03 10:40:42 173

原创 python“哥德巴赫猜想——一条线上的蚱蜢”问题

在一次移动中,它可以跳跃一些整数距离,不能被整除k,向左或向右。每个跳跃距离应从−109自109.可以证明,对于跳跃次数最少的任何解决方案,存在跳跃次数相同的解决方案,使得每次跳跃都来自−109自109.每个测试用例的唯一一行包含两个整数x和k(1≤x≤100;2≤K≤100) — 分别是跳转的端点和约束。在第二行中,打印n整数,每个整数都不能被整除k.正整数表示向右跳,负整数表示向左跳。对于每个测试用例,在第一行中打印一个整数n—蚱蜢到达点所需的最小移动次数x.可以证明,在给定的约束下,答案始终存在。

2025-03-03 10:40:08 206

原创 python“森林猎人”问题

2.如果他们选择同一个目标,小明杀死目标的概率为 p,小华杀死目标的概率为 1-p。然后他们会猎取其他猎物,小明杀死目标的概率为 p,小华杀死目标的概率为 1-p。比赛开始前,小明在森林的东边,小华在森林的西边。但是小明非常了解小华。他知道小华选择老虎作为第一个目标的概率是 q,而选择狼的概率是 1-q。因此小明请聪明的你帮忙决定他的第一个目标,使他的预期分数尽可能高。针对输入,打印出小明应该选择的目标和他可以获得的最高预期分数,在一行中用空格隔开。1.如果他们选择不同的目标,他们都有把握杀死各自的目标。

2025-03-03 10:39:54 134

原创 python“滚石“问题

现在有一个数组 stone 表示一系列在同一平面的滚石。stone 中的元素绝对值表示滚石的大小,元素的正负表示滚石滚动的方向,正向右,负向左,且大小不同的滚石滚动的速度相同。现在滚石在同一时间滚动,滚石相撞,较小的石头被摧毁,如果大小相同则都会被摧毁,两颗滚石方向相同则永远不会相撞。请你输出碰撞后还剩下的滚石。第二行有 stoneSize 个整数,表示数组 stone 的所有元素,每个整数用一个空格隔开。第一行有一个整数 stoneSize,表示数组 stone 的大小;

2025-03-03 10:39:44 231

原创 python“猴子吃香蕉”问题

狒狒可以决定她吃香蕉的速度 k (单位:根/小时)。每个小时,她将会选择一堆香蕉,从中吃掉 k 根。如果这堆香蕉少于 k 根,她将吃掉这堆的所有香蕉,然后这一小时内不会再吃更多的香蕉,下一个小时才会开始吃另一堆的香蕉。这里有 n 堆香蕉,第 i 堆中有 piles[i] 根香蕉。输出一个整数 k,表示狒狒可以在 h 小时内吃掉所有香蕉的最小速度 k(k 为整数)。返回她可以在 h 小时内吃掉所有香蕉的最小速度 k(k 为整数)。狒狒喜欢慢慢吃,但仍然想在警卫回来前吃掉所有的香蕉。

2025-03-03 10:38:24 195

原创 python “爬楼梯问题“

数组的每个下标作为一个阶梯,第 i 个阶梯对应着一个非负数的体力花费值 cost[i](下标从 0 开始)。每当爬上一个阶梯都要花费对应的体力值,一旦支付了相应的体力值,就可以选择向上爬一个阶梯或者爬两个阶梯。最低花费方式是从 cost[0] 开始,逐个经过那些 1 ,跳过 cost[3] ,一共花费 6。在开始时,你可以选择从下标为 0 或 1 的元素作为初始阶梯。最低花费是从 cost[1] 开始,然后走两步即可到阶梯顶,一共花费 15。输出一个整数,表示达到楼层顶部的最低花费。

2025-03-03 10:38:05 229

原创 CTF 多层加密压缩文件解压

大概记得题目是给了一个压缩了500次的压缩包,每层压缩包中都包含一个txt文件和下一层压缩包,提醒他中是简短的计算,可以通过eval函数求值的那种,求出来的值是下一层压缩包的解压密码。勿要提问,作者已经Out of CTF了。解题的脚本如下,希望能帮到你。

2025-03-02 15:28:07 403

原创 python脚本实现post传值

一个简短的python脚本,可以向某一url post一个值。

2025-03-02 15:24:20 93

原创 python演示决策树算法

决策树是一种简单直观的分类与回归方法,它呈树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表不同的判断结果,叶节点则代表最终的分类或预测结果。决策树通过递归地选择最优属性来划分数据,直到满足停止条件。它易于理解和解释,能够处理多种数据类型,包括离散型和连续型数据。然而,决策树容易过拟合,因此常需要进行剪枝处理。总的来说,决策树是一种有效的机器学习算法,广泛应用于分类、回归等领域。计算色泽的分支节点的信息熵。有任何问题可向作者提出。

2025-03-02 15:19:24 218

原创 python演示遗传算法

遗传算法是一种模拟生物进化过程的启发式搜索算法,它通过选择、交叉和变异等操作,不断优化问题的解决方案。该算法将问题的解编码为染色体,随机生成初始种群,并定义适应度函数评估个体性能。随后,根据适应度选择个体繁殖,通过交叉生成新后代,并以一定概率进行变异,增加种群多样性。1. 种群的交配方案有两种,一种是让种群中的个体两两交配产生新的个体,另一种是在种群中任取两个个体进行交配,选取次数为种群数量/2,代码中选取的是后者。问题描述:使用遗传算法求解f(x)=x*cos(x)+2的最大值。有任何问题可向作者提出。

2025-03-02 15:13:47 244

原创 python实现进程调度优先级抢占式算法

【代码】python实现进程调度优先级抢占式算法。

2025-03-02 15:01:17 216

原创 python演示虚拟存储调度方法(OPT/FIFO/LRU)

FIFO算法不考虑页面的实际使用情况或未来的访问模式,只是简单地按照页面进入内存的顺序进行置换。因此,在某些情况下,它可能会导致较高的缺页率,特别是当程序表现出局部性原理(即最近被访问的页面在未来很可能再次被访问)时。反之,最近最少被访问的数据,在未来被访问的几率较低。是操作系统虚拟内存调度中的最佳置换算法,它选择未来最久不被访问的页面替换,以最小化缺页中断。算法步骤简述:初始化页面,程序访问时检查页面是否在内存,不在则产生缺页中断,选择未来最晚被访问的页面替换。演示略,有任何问题可向作者提出。

2025-03-02 14:55:53 343

原创 python实现银行家算法

银行家算法是一种用于避免死锁的著名算法,它通过预先分配资源的方式来确保系统始终处于安全状态。该算法模拟银行家管理资金的方式,在分配资源前预测资源分配的安全性,从而避免系统进入死锁状态。简而言之,银行家算法通过预先检查资源分配的安全性,来确保系统不会因资源竞争而陷入死锁。有任何问题可向作者提出。

2025-03-02 14:48:14 404

原创 python RSA算法

使用python实现RSA加解密算法,根据参数p=61,q=53,m=’hello world’随机选取e生成公私钥对和密文c,再对密文解密还原。使用费马因子分解法分解整数:476714679652321667。使用小指数迭代攻击法破解以下密文,其中。有任何问题可向作者提出,庆的同学除外。庆的密码学课程实验罢了:(

2025-03-02 12:19:23 293

原创 python实现数字签名算法

【代码】python实现数字签名算法。

2025-03-02 12:11:35 175

原创 python维吉尼亚算法

明文:ATTACKATDAWN,密钥:LEMONLEMONLE,密文:LXFOPVEFRNHR。测试重复出现的二个字母的组合:TN,PM,QF,XG,PJ,UCW,JA,JH,WV,例1:课后习题,对于下面是一段经过维吉尼亚加密的密文,请你找出它的密钥并解密出原文。(2)对于维吉尼亚密码,练习使用密钥对密文进行解密得到明文的操作;(3)练习针对维吉尼亚密码,使用Kasiski测试确定密钥长度;(1)对于维吉尼亚密码,练习使用密钥对明文进行加密生成密文;例2:选做:课本例题3.12(P59页)

2025-03-02 12:08:38 527

原创 python试卷管理系统

1.一开始的用户信息是空的,用户信息文件由学校给出,由学校指派的超级管理员提前录入到数据库中去,录入一一个xlsx格式的表格,格式为:第一列为学号/工号,第二列为用户种类 Student / Teacher / Admins / Super_admins。1.第一列是题干,必须以 #单选题# / #多选题# / #判断题# / #填空题# / #主观题# 来开头,这些字符会被吸收掉,然后就开始录入题干。一开始题库是空的在后端数据里面有一些示例题目,学校的管理员可以将它们拖动到同层文件夹下导入。

2025-03-02 11:57:46 359

原创 python快递管理系统

这是一个基于python+SQL的实时快递管理系统,具有用户/快递站/快递总公司三级权限系统。

2025-03-02 11:39:36 1029 2

原创 基于eval函数实现最简单的计算器功能(python)

1.这是一个简易计算器,运行后可以通过按钮输入数字来进行运算2.计算一次结果之后需要点击clean才能够重新使用3.计算的核心算法是python的eval函数,这个函数可以将一个字符串解开来当作代码来运行并返回结果,因此我们将所有输入的数据存在一个字符串里,最后用eval函数计算输出结果到计算器屏幕上就行了

2025-03-02 10:33:01 224

原创 python调用命令行统筹运行你的小工具

在本专栏中介绍了一些工具,这里相当于为它们编写了一个主菜单,方便你进行管理。最后运行main即可。

2025-03-02 10:26:08 206

原创 python实现建议连点器(支持动作链)

13.如果同级目录下已经存在名为"动作链.txt"的文件那么读取操作将会对其内容进行覆写,如果你想保留一组动作请将读取到的文件备份到其他地方。2.支持的特殊的按键有esc,tab,space,shift,ctrl,capslock,其他的可能不支持,4.支持的组合键有ctrl+c,ctrl+v,ctrl+s,ctrl+a其他的不支持。7.动作链.txt文件里面记录着读取到的动作,你可以对其进行修改以对你的动作进行修正。来结尾,这是因为这是读取时自动创建的文件的标准结尾格式,否则你的最后三个动作将被舍弃。

2025-03-01 22:34:55 346

原创 python实现键盘点击具有音效的功能(小黑子勿进!!!)

运行后有两种模式,一种是让你的键盘每一个键都“坤”叫,另一种是某些按钮有特定的声音。我们将使用pygame的mixer组件来播放音效,使用tk来实现ui。编写一个函数,使得按下一个按钮的时候通过传参的方法来实现出声。本项目所有素材已经免费上传,有任何问题可联系作者。

2025-03-01 22:29:33 171

原创 使用python实现自动更换windows壁纸的功能

原理:编写一段能够更换壁纸的代码使用pyinstaller封装成exe放在开机自启动的文件夹下即可。为我们的工具编写一个简单的ui吧(本人审美很差,请根据个人喜好调整)有任何问题可联系作者。导入必要的库:(没有的库请自行安装)

2025-03-01 22:20:55 219

原创 python简易图片爬虫(基于requests而非selenium)

1.这是一个图片爬虫,运行后输入一个关键词,它就会自动爬取图片并下载到一个以关键词来命名的文件夹里2.爬取到的图片的像素并不高,都是几十kb左右3.爬取到的数量为一两百张,根据关键词的热度而波动4.图片的来源主要是百度,搜狗跟必应,考虑到谷歌需要翻墙就没有爬5.当然还有许多搜索引擎是可以爬的,不过考虑到爬虫的合法性跟大量爬取图片可能会封禁ip就没有爬6.从程序运行到爬取完毕大概需要一两分钟,请耐心等待

2025-03-01 22:12:52 199

原创 本人初期学习py时做的笔记,自用,勿作评论

15.逻辑运算符:0&0=0;8.判断一个数据的类型常用“ is+类型 ”的方法(字符串才可用),表达式返回bool型,如:a = "3" print(a.isdigit())返回False。31.在输入”x y“时可以使用 x, y = map(int, input().split())快速接收这个int(值)11.列表转字典的方法:list1=[a,b],list2=[1,2], dict1=dict(list1,list2)

2025-03-01 22:04:34 758

原创 本人初期学习py时实现的小功能(21-27),自用,勿作评论

【代码】本人初期学习py时实现的小功能(21-27),自用,勿作评论。

2025-03-01 21:59:16 89

原创 本人初期学习py时实现的小功能(11-20),自用,勿作评论

【代码】本人初期学习py时实现的小功能(11-20),自用,勿作评论。

2025-03-01 21:58:00 117

原创 本人初期学习py时实现的小功能(1-10),自用,勿作评论

【代码】本人初期学习py时实现的小功能,自用,勿作评论。

2025-03-01 21:56:32 88

原创 本人初期学习py时留下的文件(31-43),自用,勿作评论

【代码】本人初期学习py时留下的文件,自用,勿作评论。

2025-03-01 21:49:17 111

原创 本人初期学习py时留下的文件(21-30),自用,勿作评论

【代码】本人初期学习py时留下的文件,自用,勿作评论。

2025-03-01 21:46:47 102

原创 本人初期学习py时留下的文件(11-20),自用,勿作评论

【代码】本人初期学习py时留下的文件,自用,勿作评论。

2025-03-01 21:45:24 107

原创 本人初期学习py时留下的文件(1-10),自用,勿作评论

【代码】本人初期学习py时留下的文件,自用,勿作评论。

2025-03-01 21:43:05 118

原创 用pygame来写一个坤坤快跑小游戏

基于pygame坤坤快跑小游戏。实现我是甄艾粉,小黑子勿进。

2025-03-01 21:21:39 746 1

《python实现键盘点击具有音效的功能(小黑子勿进!!!)》素材包

《python实现键盘点击具有音效的功能(小黑子勿进!!!)》素材包

2025-03-01

《用pygame来写一个坤坤快跑小游戏》项目的全部文件

《用pygame来写一个坤坤快跑小游戏》项目的全部文件

2025-03-01

大模型入门:文本分类任务数据集

包含未处理与已经预处理的数据集。

2025-03-04

《快递管理系统》素材+代码包

《快递管理系统》素材+代码包

2025-03-02

《试卷管理系统》全部资源

《试卷管理系统》全部资源

2025-03-02

《Attention Is All You Need》.pdf

大模型的具有开辟意义的论文《Attention Is All You Need》.pdf文件

2025-03-03

Preprocessed data

包含了分割+预处理好的两个csv文件

2025-03-09

Data & Code & Model

包含了这个任务用到的数据集,源代码,以及一个训练好的小型模型。

2025-03-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除