- 博客(486)
- 资源 (4)
- 收藏
- 关注
原创 人工智能大模型-数据预处理-文本数据预处理-图像数据预处理
re模块:专注于正则表达式的字符串处理,适合文本挖掘和数据清洗。numpy:提供高效的数值计算功能,是科学计算和数据分析的基础。pandas:专注于结构化数据的处理,是数据分析和可视化的核心工具。这三个库在Python生态系统中扮演着不可或缺的角色,掌握它们对于数据处理、科学计算和机器学习都至关重要。
2025-03-31 23:26:06
946
4
原创 Transformer习题
(1) 自注意力机制的特点:(2) 位置编码的作用:(3) Transformers库主要提供的模型类别(以Hugging Face库为例):
2025-03-31 23:24:53
210
1
原创 shell脚本编程
数组类似于变量定义,只不过将里面的值用小括号括起来,其中每个元素使用空格分割。shell数组中元素的类型可以不一样,例如其中可以包含数字与字符串。
2025-03-30 00:24:37
1004
原创 Makefile多文件工程管理
prereq-patterns 则是目标的“依赖”元素,可以理解为%.c,意思就是对target-pattern中的目标进行二次定义。如果所有依赖都存在,检查规则中的目标是否需要更新,必须先检查它的所有依赖,依赖中有任何一个被更新,则目标必须更新.(检查的规则是哪个时间大哪个最新–时间戳)"="是最普通的等号,在Makefile中容易搞错赋值等号,使用“=”进行赋值,变量的值是整个Makefile中最后被指定的值。Makefile的静态模式指的是一种自动编译模式,在这种模式下,我们很容易的定义“多目标”
2025-03-30 00:23:24
943
原创 大模型概述
大模型属于Foundation Model(基础模型)[插图],是一种神经网络模型,具有参数量大、训练数据量大、计算能力要求高、泛化能力强、应用广泛等特点。与传统人工智能模型相比,大模型在参数规模上涵盖十亿级、百亿级、千亿级等,远远超过传统模型百万级、千万级的参数规模。不同于传统人工智能模型通过一定量的标注数据进行训练,一个性能良好的大模型通过海量数据及设计良好、内容多样的高质量标注语料库进行训练。
2025-03-24 23:20:22
863
原创 数据预处理习题
原理:将原始灰度范围 [a,b] 映射到更宽的范围 [c,d](如0~255),公式为:效果:低对比度图像(如灰度集中在100~150)被拉伸后,暗部更暗、亮部更亮,细节更突出。局限性:若原图灰度范围已覆盖整个动态范围,则拉伸无效;可能放大噪声。
2025-03-24 23:17:57
801
原创 大模型概述习题
(1)简述零样本学习的定义。零样本学习(Zero-Shot Learning, ZSL)是一种机器学习方法,模型在没有见过某一类样本的情况下,能够识别或处理该类数据。它通过利用类别之间的语义关系(如属性、描述等)来实现对新类别的推理。例如,模型可以通过学习“马”和“斑马”的描述,识别出“斑马”即使从未见过斑马的图像。(2)持续学习是不是一种增量学习方法?它的优势是什么?**持续学习(Continual Learning)**是一种增量学习方法,旨在让模型在不断接收新任务或新数据时,能够持续学习并保留之前学到
2025-03-13 23:13:58
232
1
原创 《汇编语言》笔记 寄存器(内存访问)
栈为空,就相当于栈中唯一的元素出栈,出后,SP-SP+2,SP 原来为000EH,加2后 SP=10H,所以,当栈为空的时候,SS=1000H,SP=10H。换一个角度看,任意时刻,SS:SP 指向栈顶元素,当为空的时候,中没有元素也就不存在栈顶元素,所以 SS:SP 只能指向栈的最底部单元下面的单元,该单元的偏移地址为栈最底部的字单元的偏移地址+2,栈最底部字单元的地址为 1000:000E,所以栈空时,SP-0010H.CPU读写一个内存单元的时候,必须先给出这个内存单元的地址。
2024-10-21 23:56:55
1170
原创 《汇编语言》笔记一 寄存器
程序段中的最后一条指令 add ax,bx,在执行前 ax和 bx 中的数据都为 8226H,相加后所得的值为:1044CH,但是 ax 为 16 位寄存器,只能存放 4位十六进制的数据,所以最高位的 1不能在 ax 中保存,ax中的数据为:044CH。程序段中的最后一条指令 add al,93H,在执行前,al 中的数据为 C5H,相加后所得的值为:158H,但是 a1为8位寄存器,只能存放两位十六进制的数据,所以最高位的1丢失,ax 中的数据为:0058H。段地址在 8086CPU 的段寄存器中存放。
2024-10-21 23:55:48
954
原创 Linux命令进阶
例如说明:管道就是将一个命令的输出当作另一个命令的输入,通过|连接多个命令(理解:后一个命令的操作,是在前一个命令的基础上进行的)
2024-10-16 22:26:11
1127
原创 Linux介绍及常用命令
1969 年,AT&T 公司的⻉尔实验室P MIT 合作开发的 Unix,í在于创建⼀个⽤于⼤型、并⾏、多⽤户的操作系统Unix 的推⼴:从学校⾛进企业Unix 的版本要两个:AT&T System V ——就是俗称的 系统 5linux是一种操作系统1991 年,芬兰赫尔⾟基⼤学的学⽣ Linus Torvals 为了能在家⾥的 PC 机上使⽤与学校⼀的操作系统,开始编写了类 UNIX.
2024-10-16 22:25:37
1272
原创 我的创作纪念日
从第一次文章上热榜到新星创作者,一路上写到很多,优快云也记录着我的成长。高中学习C语言时先了解到了51CTO网站后了解到优快云。通过优快云这个平台,认识了许多大佬,了解到前沿技术。想要记录自己的算法解题思路开始了创作生涯。平时学习知识时习惯敲成博客发布。不知不觉已经2048天年。
2024-10-16 16:12:35
251
原创 NDK开发
app为什么会把代码放到so中a) C语言历史悠久,有很多现成的代码可用b) C代码执行效率比Java高c) Java代码很容易被反编译,而且反编译以后的逻辑很清晰为什么要学习NDK开发在安卓的so开发中,其他基本与C/C++开发一致,而与Java交互需要用到jni在本部分的NDK开发讲解中,主要就是介绍jni相关内容so中会接触的:系统库函数、jni调用、加密算法、魔改算法、系统调用、自定义算法什么是JNIjni是Java Native Interface的缩写。
2024-10-15 23:16:29
1124
原创 CryptoJS(消息摘要算法)一
优点:JS实现的算法,可以很方便地被任何语言调用消息摘要算法的其他调用形式字符串解析string转wordArraywordArray转stringHex编码转Base64编码如果函数传入的参数是string类型的数据,将使用默认的Utf8.parse来解析对称加密算法CryptoJS中对称加密算法的使用cfg的详细含义cfg中没有传mode和padding,默认使用CBC的加密模式,Pkcs7的填充方式加密结果是wordArray对象,调用toSt
2024-10-15 23:12:56
338
原创 非对称加密算法
openssl rsa -pubin -in public.pem -text //以文本格式输出公钥内容。pkcs1格式通常开头是 -----BEGIN RSA PRIVATE KEY-----pkcs8格式通常开头是 -----BEGIN PRIVATE KEY-----把PKCS1Padding加密后的密文,用NOPadding去解密,会怎么样呢?没有指明加密模式和填充方式,表示使用默认的RSA/ECB/NOPadding。一般公钥是公开的,私钥保密,私钥包含公钥,从公钥无法推导出私钥。
2024-10-14 20:49:49
970
原创 对称加密算法
RC4 密钥长度1-256字节DES 密钥长度8字节3DES/DESede/TripleDES 密钥长度24字节AES 密钥长度16、24、32字节根据密钥长度不同AES又分为AES-128、AES-192、AES-256序列加密/流加密: 以字节流的方式,依次加密(解密)明文(密文)中的每一个字节RC4分组加密: 将明文消息分组(每组有多个字节),逐组进行加密。
2024-10-14 20:48:33
913
原创 消息摘要算法
a) 消息摘要算法/单向散列函数/哈希函数b) 不同长度的输入,产生固定长度的输出c) 散列后的密文不可逆d) 散列后的结果唯一e) 哈希碰撞f) 一般用于校验数据完整性、签名sign由于密文不可逆,所以服务端也无法解密想要验证,就需要跟前端一样的方式去重新签名一遍签名算法一般会把源数据和签名后的值一起提交到服务端要保证在签名时候的数据和提交上去的源数据一致。
2024-10-11 22:43:51
356
原创 密码学介绍-H5APP逆向-Hex编码-Base64编码
C/C++没有现成的系统API调用,开发者要么自己去实现算法,要么调用别人写好的模块,算法的运行不依赖系统API,因此方法名可以混淆。RSA密钥、加密后的密文、图片等数据中,会有一些不可见字符,直接转成文本传输的话,会有乱码、数据错误、数据丢失等情况出现,就可以使用Base64编码。加密可能部分在JS文件中,部分在Java中,说白了有些代码可以在调试工具中看到,有些代码是Java只能逆向app去找。客户端发送给服务器的数据包中,有些参数不知道来源,可能是随机生成、标准算法加密的、自写算法加密的。
2024-10-11 22:42:53
1435
原创 集成学习和随机森林
每个子模型只看100个样本数据每个子模型不需要太高的准确率。不使用测试数据集,而使用这部分没有取到的样本做测试/验证。虽然有很多机器学习方法,但是从投票的角度看,仍然不够多。决策树在节点划分上,在随机的特征子集上寻找最优划分特征。决策树在节点划分上,使用随机的特征和随机的阈值。提供额外的随机性,抑制过拟合,但增大了bias。集成更多的子模型的意见。针对e2训练第三个模型m3,产生错误e3…针对e1训练第二个模型m2,产生错误e2。每个子模型只看样本数据的一部分。取样:放回取样,不放回取样。
2024-10-09 21:38:06
1206
原创 植物大战僵尸修改器-MFC
MFCApplication2Dlg.cpp中将按钮与函数绑定 添加ON_BN_CLICKED(IDC_COURSE, CMFCApplication2Dlg::OnBtnClickedCourse)在MFCApplication2Dlg.h中添加void CMFCApplication2Dlg::OnBtnClickedCourse();绑定变量DDX_Control(pDX, IDC_KILL, m_bnKill);限制对话框大小 将属性中Border的值改为对话框外框。扫描减少的数值/未变动的数值。
2024-10-09 21:37:40
1274
原创 docker快速上手
一个轻量的虚拟机,让程序员不再纠结于环境部署,更多集中于代码编写,基础建设,开发作用:打包:把你软件运行所需的所有东西打包到一起分发:把你打包好的“安装包”上传到一个镜像仓库,任何人可以拿来即用部署:拿着“安装包”就可以一个命令运行起来你的应用,自动模拟出一模一样的运行环境官网下载安装。
2024-10-07 23:16:49
959
原创 Charles+socksdroid手机抓包配置
用户证书路径: /data/misc/user/0/cacerts-added。利用Magisk的Move Certificates模块 移动证书。系统证书路径:/etc/security/cacerts。安装Move_Certificates-v1.9。使用abd将证书推送到手机。选择刚刚导入手机的证书。
2024-10-04 23:45:16
1030
1
原创 AndroidStudio工程目录结构
配置哪些模块在一起编译 include ‘:app’ 只编译app。本机环境配置,SDK、NDK路径等,一般无须改动。gradle配置文件,一般无须改动。配置项目gradle版本。描述工程整体的编译规则。
2024-10-04 23:44:01
368
原创 mongoDB快速上手
MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组,下载下载完成解压缩在目下创建data/db文件夹创建logs/mongo.log创建mongo.config添加环境变量安装服务打开Windows PowerShell执行命令启动服务。
2024-09-28 23:39:13
899
原创 redis快速上手
key-value数据库,,nosql非关系数据库值可以是字符串、哈希、列表、集合和有序集合等类型开启服务器开启客户端设置ip 端口插入数据set xw 132xw为键 132为值获取值获取程度strlen xw追加长度同时设置多个 获取多个。
2024-09-28 23:37:55
948
原创 机器学习-逻辑回归
逻辑回归:解决分类问题逻辑回归既可以看做是回归算法,也可以看做是分类算法通常作为分类算法用,只可以解决二分类问题代码实现实现逻辑回归加载数据使用逻辑回归。
2024-02-08 23:17:19
1224
原创 多项式回归与模型泛化
模型误差=偏差(Bias)+方差(Variance)+不可避免的误差。非参数学习通常都是高方差算法。参数学习通常都是高偏差算法。随着训练样本的逐渐增多,算法训练出的模型的表现能力。传入poly_reg的数据 会依次执行管道的内容。算法所训练的模型过多地表达了数据间的噪音关系。大多数算法具有相应的参数,可以调整偏差和方差。有一些算法天生是高方差的算法。有一些算法天生是高偏差算法。算法所训练的模型不能完整表述数据关系。数据的一点点扰动都会较大地影响模型。通常原因,使用的模型太复杂。如线性回归中使用多项式回归。
2024-02-07 23:36:04
1061
原创 PCA与梯度上升法
主成分分析(Principal Component Analysis)找到一个轴,使得样本空间的所有点映射到这个轴后,方差最大。数据进行改变,将数据在第一个主成分上的分量去掉。求出第一主成分以后,如何求出下一个主成分?如何找到这个让样本间间距最大的轴?主成分个数可解释95%+的方差。在新的数据上求第一主成分。速度提高了 精度降低了。如何定义样本间间距?
2024-02-07 23:35:08
670
原创 机器学习-梯度下降法
并不是所有函数都有唯一的极值点代码演示梯度下降法可视化封装eta = 0.01时eta = 0.001时eta = 0.8时优化 避免死循环eta = 1.1时。
2024-02-06 23:21:28
1266
1
Hands-On Large Language Models - Jay Alammar 袋鼠书 《动手学大语言模型》
2025-04-02
深度学习-多层感知器-建立MLP实现非线性二分类-MLP实现图像多分类 的 data.csv
2025-03-18
停车场信息表.xlsx
2024-01-20
考研周洋鑫高数基础笔记
2023-12-06
计算机图形学 期末复习 微课版 孔令德 期末复习
2023-07-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人