- 博客(12)
- 收藏
- 关注
原创 RNN模型原理,代码实现
RNN又称循环神经网络,是一种在序列数据处理中广泛使用的神经网络模型。具有循环连接,允许信息在网络中持续传递。能够处理任意长度的输入序列,并且在处理序列时共享参数,这也是该模型在自然语言处理、语音识别、时间序列预测等任务中取得出色表现的主要原因。
2024-01-09 20:05:49
1765
原创 NLP常用编码方式--onehot、word2vec、BERT
BERT编码方式是依赖于huggingface官网所提供的预训练模型进行的,在使用时可以根据文字的具体类型和需要,在官网上下载,并使用pytorch调用模型对数据编码。在下面的示例中,我们首先加载了预训练的 BERT 模型和分词器(one-hot是一种词嵌入方式,编码方式较为较为简单,就是将每一个词或字都表示为一个向量,仅在该词或字所在的位置设置为1,其余位置均为零。在进行自然语言处理时,对文字进行编码一个十分必要的步骤文字编码的目的是将文本数据转换为计算机可以理解和处理的数字表示形式。
2024-01-04 21:51:17
2794
1
原创 (4)Dataset和Dataloader详解
首先让我们来看一下数据在这两个类中是如何流转的,这能够帮助我们更好的了解Dataset和Dataloader的作用方式。例如,选择合适的批次大小、是否打乱数据集、是否利用多进程加速数据加载等,以最优化数据处理的性能和效果。与Dataset相同,Dataloader类也是Pytorch预定义好的一个基类,是Dataset和sampler的组合。函数在每一次的迭代中循环取出数据,并转入到Dataset中对数据进行处理,也就是使用。的数据加载器实例,指定了批次大小、是否打乱数据集、以及加载数据的子进程数量。
2024-01-02 16:03:50
1164
原创 自然语言处理入门0
自然语言处理(Natural Language Processing,NLP)是计算机科学和人工智能领域的一个分支,涉及处理和理解人类语言的能力。它致力于使计算机能够与人类语言进行交互、理解和生成自然语言。NLP涉及了多种技术和方法,用于处理和分析文本、语音和其他形式的人类语言数据。
2023-12-24 16:47:42
348
原创 (3)pytorch中构建一个分类器
分类器本质上是一种特殊的神经网络,用于判断输入数据的类别。通常,分类器是由神经网络的最后一层通过一个激活函数进行转换得到的结果。在神经网络中,数据通过多个层进行传递和转换,最终到达输出层。输出层的神经元数量通常与分类任务中的类别数量相匹配,每个神经元对应一个类别。输出层的激活函数决定了输出的形式。例如,在二分类任务中,常用的激活函数是Sigmoid函数,将输出限制在0和1之间表示概率;而在多分类任务中,常用的激活函数是Softmax函数,用于对输出进行归一化,表示每个类别的概率。
2023-12-24 15:15:36
634
原创 (2)pytorch中构建一个神经网络
本文主要讲述了在pytorch框架下,如何构建一个简单的神经网络,并将网络应用于数据的训练当中,主要描述了有关torch.nn常用函数,损失函数,反向传播,网络参数更新等内容。
2023-12-22 12:36:49
1146
原创 中文分词(2)--正向、反向、双向匹配
介绍了有关正向、反向和双向最大匹配算法的基础知识,并手动描述具体的实现流程。并使用python分别实现这三种算法
2023-12-12 21:00:14
2330
原创 中文分词(1)--正则表达式
正则表达式是由一系列字符和特殊字符组成的模式,用于描述和匹配字符串的规则。这些函数和方法提供了基本的正则表达式功能,可以用于字符串的匹配、搜索、替换等操作。在编程语言中,通常会提供正则表达式的库或模块,用于处理正则表达式的操作。:在字符串中搜索匹配模式的第一个位置,如果匹配成功则返回一个匹配对象,否则返回。:返回一个迭代器,包含字符串中所有与模式匹配的非重叠子字符串的匹配对象。:从字符串的开头开始匹配模式,如果匹配成功则返回一个匹配对象,否则返回。:返回字符串中所有与模式匹配的非重叠子字符串的列表。
2023-12-12 16:46:01
1197
原创 FIFO和LRU实现(含代码)
#include <iostream>using namespace std; const int MAX=6; //主存块数不超过6 int FS=0; //缺页中断次数 double FSL=0.00; //缺页中断率 int M[MAX]; //主存中的内容 int n; //主存块数 struct pro{ int time; //时刻 int P; //页面走向 int F; //缺页中断表示 };//输入信息函数void input(
2021-11-29 10:46:15
529
原创 排序算法的实现与性能比较
任务要求利用随机函数产生不少于30000个随机整数,利用直接插入排序、起泡排序、选择排序、快速排序、堆排序、归并排序等排序方法进行排序,并统计每一种排序上机所花费的时间。系统功能本系统通过rand函数产生相应的随机数,并键盘输入相应的指令来选择相应的排序方式,如直接插入排序、起泡排序、选择排序、快速排序、堆排序、归并排序等。同时利用函数计算不同排序方式排序所需要的时间。系统功能数据的逻辑结构为线性表,直接插入排序的存储结构是顺序存储结构;起泡排序的存储结构是顺序存储结构;选择排序的存储结构是顺序存
2021-01-02 14:53:30
2103
2
编译原理-KMP算法-C++
2023-12-11
编译原理-DFA最小化-C++
2023-12-11
操作系统-调度算法-C++
2023-12-10
操作系统-电梯调度算法-C++
2023-12-10
操作系统-C++-银行家算法
2023-12-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人