- 博客(11)
- 收藏
- 关注
原创 深度学习大模型补充知识点
了解大语言模型的预训练,指令微调,强化学习的概念和典型例子。以及大模型的不同架构实例,分为only-encoder,only-decoder,encoder-decoder;
2025-03-14 18:00:04
453
原创 transformer入门详解
transformer是大模型的基础,由encoder和decoder组成,以翻译任务为例,输入一句话经过transformer生成其翻译内容。实际应用中,都是由多个encoder和多个decoder构成编码器和解码器。
2025-03-12 23:51:54
1005
原创 深度学习入门系列(七)之Bert实战文本情感分类项目
1)导入必要的包2)创建模型导入下载的Bert模型因为利用训练好的Bert进行分类,所以实际上model模块只需要两部分,导入BERT以及自己的分类头self.cls_head = nn.Linear(768, num_class) 输入768维特征,输出分类至自己的分类结果def __init__(self, bert_path, num_class, device):#传入bert路径和自己的分类数。
2025-03-11 12:27:20
1426
原创 深度学习入门系列(六)之无监督学习,Bert引入
本次讨论前两个。RNN和LSTM对应词性识别,简单的句子可能只需要考虑单个字就行但对于复杂句子,以及有些字在不同情况下词性不同,就不能只考虑单个字了。就需要考虑前后关系。于是就有了RNN,循环神经网络。
2025-03-06 10:33:54
783
原创 深度学习入门系列(五)之图片分类实战及数据处理方法
本篇主要讲解食物分类实战训练和验证部分代码并引入半监督学习,包含迁移学习和图片增广等数据处理方法。食物图片一共分为11个类别,其中带标签的数据:28011,不带标签的训练数据: 6786验证集3011,测试集3347。这个可看可不看,因为我们主要用别人训练好的模型nn.BatchNorm2d(64), # 归一化,要和输出的通道数保持一致nn.ReLU(),nn.BatchNorm2d(128), # 归一化nn.ReLU(),nn.BatchNorm2d(256), # 归一化。
2025-03-05 17:00:40
1166
原创 深度学习入门系列(4)之图片分类
将其转为数值来看就是这样,用1表示红色,-1表示黑色,小矩阵作为卷积核,用卷积核对大的特征图处理了以后可以得到后面的4×4的特征图,其中只标出了几个点位的数据,可以对比带颜色的那个图来看,可以发现,得到数值越高的地方和和卷积核的相似度越高,比如7那个位置,在原图上只差了右上角的红色方块,而9那个位置和卷积核一摸一样,-3那个位置和卷积核差别很大,因此数值也小。网络这样写是因为VGG那些卷积层都是类似的结构,因此先定义一个vgg层的类,然后在定义网络的类上传入参数调用vgg层的类,可以避免写的很繁琐。
2025-03-04 17:48:47
1219
原创 深度学习入门系列(3)之回归实战
目录1.1训练流程1.2输出改进2,导入模块3,定义数据集的类4,定义模型的类5,定义各种内容6,训练验证函数7,测试函数8,优化项8.1选最重要的特征8.2正则化1,内容简介该项目是以一个美国四十个州统计连续三天的新冠阳性人数以及一些社会特征来推测第三天的阳性人数。是一个pytorch基本的回归项目。本文是我个人学习总结,如有问题欢迎指出~1.1训练流程训练一个简单的神经网络需要准备以下几点首先是数据Data,通过输入文件地址,读取文件内容,输入数据集。
2025-03-04 15:48:44
468
原创 深度学习入门系列(二)之线性模型代码
def data_provider(data,label,batchsize ): #提供一批数据random.shuffle(indices) # 随机排列,可通过添加断点分析get_indices = indices[each:each+batchsize] #切片get_data = data[get_indices] #获取对应切片的数据与标签yield get_data,get_label #有存档点的returnbatchsize = 16 #给定步长。
2025-03-04 10:06:58
180
原创 STL算法中常用知识点总结
STL 作为一个封装良好,性能合格的 C++ 标准库,在算法竞赛中运用极其常见。灵活且正确使用 STL 可以节省非常多解题时间,这一点不仅是由于可以直接调用,还是因为它封装良好,可以让代码的可读性变高,解题思路更清晰,调试过程 往往 更顺利。不过 STL 毕竟使用了很多复杂的结构来实现丰富的功能,它的效率往往是比不上自己手搓针对特定题目的数据结构与算法的。因此,STL 的使用相当于使用更长的运行时间换取更高的编程效率。因此,在实际比赛中要权衡 STL 的利弊,不过这一点就得靠经验了。
2025-02-16 17:20:03
1147
原创 网络安全原理——密码学入门笔记
第一章 密码学三大发展阶段及经典密码第二章 密码基础 进制与计量第三章 加密基本操作第四章 对称加密算法第五章 非对称加密算法第六章 数字签名第七章 数字证书与CA第八章 哈希与HMAC第九章 对称加密和非对称加密融合第十章 密码学原理总结。
2025-02-10 10:10:15
1006
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人