自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Casrel关系抽取

Casrel模型是一种基于参数共享的联合实体关系抽取方法,能够有效解决关系三元组重叠问题。该模型通过两个步骤实现:(1)识别句子中的subject,(2)根据subject识别可能的relation和object。模型架构包含BERT编码器、头实体识别解码器和关系-尾实体联合识别解码器三部分。文章详细介绍了数据预处理流程,包括查看数据集、配置项目变量、处理数据函数及构建Dataset类。项目使用公开的千言数据集,包含18种关系类型,训练集55,433条样本,验证集11,191条,测试集13,417条。预处理

2025-08-07 22:20:26 911

原创 pipeline方法关系抽取--课堂笔记

关系抽取Pipeline方法与BiLSTM+Attention模型笔记 本文介绍了关系抽取的两种主要方法:Pipeline方法和BiLSTM+Attention模型。Pipeline方法通过先识别实体再进行关系分类的两阶段处理,虽然实现简单但存在误差积累问题。BiLSTM+Attention模型则结合双向LSTM和注意力机制,通过输入层、词嵌入层、BiLSTM层、注意力层和输出层的五部分结构,有效捕捉上下文信息并关注关键词。文章还详细说明了数据预处理步骤,包括查看数据集、配置项目参数、处理文本数据等过程,为

2025-08-05 22:15:21 1202

原创 规则方法关系抽取-笔记总结

定义:对于一段文本,抽取出其中的SPO三元组,S:subject;主实体关系(预测)O:object;客实体。

2025-08-04 23:43:39 341

原创 基于BiLSTM+CRF实现NER

本文介绍了基于BiLSTM+CRF的命名实体识别(NER)模型实现。BiLSTM负责生成发射分数,CRF则对标签序列进行约束和解码。文章详细讲解了CRF的原理、损失函数计算及前向算法优化,并提供了完整的项目实现步骤,包括数据预处理(BIO标注格式转换)、配置文件设置等关键环节。该模型能有效解决序列标注问题,在医疗文本等领域的实体识别任务中表现优异。

2025-08-03 21:54:07 989

原创 知识图谱介绍

Doccano是一种用于文本标注的开源工具,旨在简化和加速标注任务的进行。它提供了一个直观的用户界面,使标注人员能够轻松地对文本数据进行标注,并创建高质量的训练数据集用于机器学习和自然语言处理任务。Doccano的一些主要特点和功能:多种标注类型:Doccano支持多种常见的文本标注任务,如命名实体识别、文本分类、关系抽取等。您可以根据具体任务的需求选择适当的标注类型。协作标注:多个标注人员可以同时使用Doccano进行协作标注。

2025-08-02 23:13:29 834

原创 注意力机制介绍

通俗理解注意力机制原理与本质:Q(query)、K(key)、V(value)- 第一步【查询】:打开京东网站,我们输入查询(query,Q),比如“笔记本”- 第二步【计算相似性】:京东后台拿到这个查询Q,会用这个查询Q去和后台的所有商品的关键字(或者title)(key, K)一一来对比,找到物品和我们查询的相似性(或者说物品对应的相似性的权重),相似性越高,越可能推送给我们。

2025-08-01 23:15:28 302

原创 迁移学习文本分类的案例

在Dataloader里面自动调用,目的是处理dataset里面的数据,进行张量化处理代码实现'''data:是从dataset里面获取的数据.类型为list,[第一个样本,第二样本,。。。# data传过来的数据是list eg: 批次数8,8个字典'''

2025-07-30 12:01:46 262

原创 迁移学习记录

迁移学习摘要 迁移学习是利用预训练模型解决新任务的技术,主要包括两种方式:直接使用预训练模型(开箱即用)和微调模型。预训练模型分为三类:仅编码器(如BERT)、仅解码器(如GPT)和编码器-解码器(如T5)。通过Pipeline方式可以快速实现文本分类、特征抽取、完形填空、阅读理解、文本摘要和命名实体识别等任务。AutoModel方式则提供更灵活的操作,如加载分词器和模型处理文本分类任务。迁移学习能有效利用已有知识,减少训练成本,提升模型性能。

2025-07-29 16:58:05 167

原创 PyTorch框架使用

张量是PyTorch中的核心数据抽象PyTorch中的张量就是元素为同一种数据类型的多维矩阵,与NumPy数组类似。PyTorch中,张量以"类"的形式封装起来,对张量的一些运算、处理的方法(数值计算、矩阵操作、自动求导)被封装在类中。多个二维张量组成三维张量多个三维张量组成四维张量多个四维张量组成五维张量。

2025-05-02 10:33:37 1274

原创 线性回归(一)

上产生一个增量Δx时,函数输出值的增量Δy与自变量增量Δx的比值在Δx趋于0时的极限a如果存在,a即为在。一个函数在某一点的导数描述了这个函数在这一点附近的变化率。复合函数求导:g(h)是外函数 h(x)是内函数。因为求解的w,都是w的零次幂(常数项)所以叫成线性模型。​ 引入损失函数(衡量预测值和真实值效果) Loss(k, b)​ 通过一个优化方法,求损失函数最小值,得到K最优解。函数在某一点的导数就是该函数所代表的曲线在这一点上的切线斜率。又如何求损失函数的最小值呢?

2025-04-17 16:43:45 1149

原创 机器学习-KNN算法

1.掌握KNN算法分类API2.掌握KNN算法回归API数据文件 train.csv 和 test.csv 包含从 0 到 9 的手绘数字的灰度图像。每个图像高 28 像素,宽28 像素,共784个像素。每个像素取值范围[0,255],取值越大意味着该像素颜色越深训练数据集(train.csv)共785列。第一列为 “标签”,为该图片对应的手写数字。其余784列为该图像的像素值训练集中的特征名称均有pixel前缀,后面的数字([0,783])代表了像素的序号。# 1. 显示图片.

2025-04-14 21:31:16 1384

原创 Numpython学习汇总

它是 Python 语言的一个扩展程序库。是一个运行速度非常快的数学库.主要用于数组计算包含:一个强大的N维数组对象 ndarray广播功能函数整合 C/C++/Fortran 代码的工具线性代数、傅里叶变换、随机数生成等功能PandasPandas是一个强大的分析结构化数据的工具集它的使用基础是Numpy(提供高性能的矩阵运算)用于数据挖掘和数据分析,同时也提供数据清洗功能Pandas利器之 Series,是一种类似于一维数组的对象。

2025-03-31 12:41:33 1142

原创 Linux笔记记录

Linux的命令格式介绍# 格式# 解释command: 表示命令, 必写.options: 表示选项, 如果需要就写, 可以省略, 会用默认值(如果有)parameter: 表示参数, 如果需要就写, 可以省略, 会用默认值(如果有)

2025-03-28 19:36:48 1055

原创 python中多进程、多线程的基本使用

"""案例: 演示自定义上下文管理器.细节:1. with ... as ... 会在其内容执行完毕后, 自动使用.2. with ... as ... 功能之所以强大, 背后就是靠 上下文管理器来支撑的.3. 一个类, 只要重写了 __enter__(), __exit__() 这两个函数, 它就是 上下文管理器.特点:1. __enter__() 会在 with语句之前 自动执行.2. __exit__() 会在 with语句之后 自动执行."""

2025-03-24 22:05:19 706

原创 浅学LangChain框架(环境配置及成功运行)

LangChain框架概述和组成配置Path环境变量案例_代码生成案例遇到问题后的解决方案首先要在配置完Path环境变量后,立马***重启PyCharm!!!***最好可以重启电脑。如果没有配置环境Path的话可以将用于接受的dashscope_api_key的变量名改为api_key。亲测有效

2025-03-17 23:49:32 472

原创 Python学习日记(day03)-----习题记录

于是自然的在捕获异常的后面加上了finally: f.close()奈何本人刚学python,确实无法找到哪里有错,还望大佬能够指点迷津!用以上的代码的话,程序可以正常运行且结果一致。惊人的事情发生了,我的结果变成了只会。了,并不是题目要求的累加和!

2025-03-13 22:55:09 292

原创 Python学习日记(day02)-----容器基础(二)

关于容器的公共运算符、函数以及推导式

2025-03-11 22:26:04 549

原创 Python学习日记(day01)-----容器基础(一)

目的是为了记录自己的学习过程,纯新手。写的不好望大家谅解。

2025-03-10 22:58:59 498 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除