自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 NLP学习Day07-注意力机制笔记

本文介绍了注意力机制的基本概念及其在深度学习中的应用。注意力机制通过模拟人类感知方式,让机器能够聚焦数据中的重要部分。其核心由查询(Q)、键(K)、值(V)三个元素构成,计算过程包括相似度计算、权重归一化和加权融合三个步骤。文章详细阐述了三种注意力计算规则,并比较了软注意力、硬注意力和自注意力的区别。通过代码示例展示了注意力机制的具体实现方法,包括线性变换和注意力权重计算。注意力机制能有效解决长距离信息弱化问题,具有参数少、速度快、效果好的优势,在机器翻译等任务中表现突出。

2025-12-08 15:45:33 104

原创 NLP学习day06-RNN人名分类器

RNN人名分类器案例摘要 本案例构建了一个基于RNN的人名国家分类器,主要流程包括: 数据预处理:读取txt格式的人名-国家数据,构建Dataset和Dataloader 模型搭建:实现RNN网络结构,包含输入层、RNN层、线性层和Softmax输出层 模型测试:验证数据流通过程和维度转换 关键点: 使用one-hot编码表示人名中的每个字母 自定义Dataset类处理变长人名输入 RNN模型输出最后时间步的隐藏状态进行分类 支持batch_first=True的数据输入格式 该模型可扩展为LSTM/GRU

2025-11-28 19:09:12 295

原创 NLP学习day04-RNN及其变体

本文介绍了RNN及其变体的基本原理和应用。RNN通过引入时间步概念处理序列数据,适用于文本翻译、分类等NLP任务。文章详细解析了传统RNN的结构特点、实现代码及其优缺点,并重点阐述了LSTM模型的内部机制(包括遗忘门、输入门等结构)和双向LSTM的实现方式。通过对比分析指出:传统RNN计算效率高但存在长序列梯度问题,LSTM能有效缓解梯度问题但计算复杂度较高。最后给出了PyTorch实现代码示例,展示了RNN和LSTM的具体应用方法。

2025-11-27 14:20:31 405

原创 NLP学习day03-文本预处理

本文介绍了文本数据分析的几个关键方法:1)标签数量分布分析,通过可视化检查正负样本比例,为数据增强提供依据;2)句子长度分布分析,确定合适的截断补齐长度;3)正负样本散点图,定位异常数据点;4)词汇总数统计,计算训练集和验证集的词汇量;5)形容词词云生成,可视化文本特征。这些方法使用Python的pandas、seaborn和jieba等库实现,能有效评估语料质量,为后续NLP模型训练提供数据支持。文章包含详细的代码示例,展示了从数据读取到可视化分析的全流程。

2025-11-26 17:57:16 286

原创 NLP学习day02-文本预处理

本文介绍了文本张量的三种表示方法:One-Hot编码、Word2Vec模型和WordEmbedding词向量。One-Hot编码简单但存在维度爆炸问题,Word2Vec通过CBOW和Skipgram两种无监督训练方式获取词向量,能更好地捕捉词间关系。文章还展示了使用fasttext训练词向量的过程,以及通过PyTorch的nn.Embedding层实现词向量可视化的方法。这些技术为自然语言处理任务提供了有效的文本数值化表示方案。

2025-11-25 15:22:06 368

原创 NLP学习Day01

本文介绍了自然语言处理(NLP)的基础知识和文本预处理技术。首先概述了NLP的定义、发展历程和应用场景,包括从1950年代至今的技术演进。重点讲解了文本预处理方法,特别是中文分词技术,详细介绍了jieba工具的精确模式、全模式和搜索引擎模式三种分词方法,以及自定义词典的使用。此外还介绍了命名实体识别和词性标注的基本概念。最后简要说明了文本张量表示的三种方法(one-hot、word2vec、wordEmbedding),为后续NLP模型训练奠定基础。

2025-11-24 15:02:56 218

原创 Spring学习(二)

梳理这个几个维度来回答@Controller @Service @RestController @RequestBody,@Indexd @Import等@Indexd提升 @ComponentScan的效率@Import注解是import标签的替换,在SpringBoot的自动装配中非常重要,也是EnableXXX的前置基础。看下图上图是循环依赖的三种情况,虽然方式有点不一样,但是循环依赖的本质是一样的,就你的完整创建要依赖与我,我的完整创建也依赖于你。相互依赖从而没法完整创建造成失败。

2023-05-09 10:23:10 273 1

原创 对称二叉树问题

给你一个二叉树的根节点 root , 检查它是否轴对称。

2023-05-08 15:51:00 222

原创 解决远程调用三方接口:javax.net.ssl.SSLHandshakeException报错

最近在对接腾讯会议API接口,在鉴权完成后开始调用对方的接口,在此过程中出现调用报错:javax.net.ssl.SSLHandshakeException。

2023-05-08 14:25:54 13638 1

原创 MQ自主学习

也就是说,一旦我们获得消息的数量够batch.size的数量了,他将会立即发送而不顾这项设置,然而如果我们获得消息字节数比batch.size设置要小的多,我们需要“linger”特定的时间以获取更多的消息。这个设置默认为0,即没有延迟。虚拟消息服务器,vhost,本质上就是一个mini版的mq服务器,有自己的队列、交换器和绑定,最重要的,自己的权限机制。但是其实这个调用是不需要直接同步调用接口的,如果用MQ给他异步化解耦,也是可以的,你就需要去考虑在你的项目里,是不是可以运用这个MQ去进行系统的解耦。

2023-04-26 14:57:45 269 1

原创 Spring

主要用于日志记录,性能统计,事务处理,异常处理,将代码从业务逻辑中分离出来,将其独立到非业务逻辑的方法中,进而改变这些行为时不影响业务逻辑的代码。(动态代理)(预编译)切点:匹配连接点的断言,在AOP中通知和一个切入点表达式关联。

2023-04-24 16:06:51 133 1

原创 SpringMVC

XMLHttpRequest是ajax的核心,通过XMLHttpRequest对象,Web开发人员可以在页面加载以后进行页面的局部更新常用的方法:open(get/post,url,是否异步)创建http请求send()发送请求给服务器setRequestHeader()设置头信息(使用post才会用到,get并不需要调用该方法)

2023-04-23 15:44:07 82

原创 Docker学习

镜像(Image):Docker 镜像(Image),就相当于是一个 root 文件系统。比如官方镜像 ubuntu:16.04 就包含了完整的一套 Ubuntu16.04 最小系统的 root 文件系统。容器(Container):镜像(Image)和容器(Container)的关系,就像是面向对象程序设计中的类和实例一样,镜像是静态的定义,容器是镜像运行时的实体。容器可以被创建、启动、停止、删除、暂停等。仓库(Repository):仓库可看成一个代码控制中心,用来保存镜像。 D

2023-04-19 15:56:05 86

原创 Java基础(一)

效率:String < StringBuffer

2023-04-19 15:39:30 91

java(2).doc

java(2).doc

2023-04-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除