自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 为Ollama添加自定义(huggingface)模型时遇到的报错

下面写一写在为ollama添加自定义模型的时候遇到的报错及可能的原因,希望可以提供一些帮助。

2024-12-23 17:39:09 1750

原创 为Ollama添加本地自定义(非官方仓库)模型详细教程

为docker内的Ollama添加本地自定义(非官方仓库)模型详细教程

2024-12-23 16:47:06 1717

原创 优化bert_large_ner提高ORG实体的边界识别能力(二)

【代码】优化bert_large_ner提高ORG实体的边界识别能力:示例代码写一下具体如何处理原本的BIO数据集,达到自己的数据集与bert分词器获得的label可以对应的效果,以及最后padding到统一长度,方便输入模型中。然后把df转化成dataset格式,能正确输入到模型中

2024-07-15 17:52:34 313

原创 优化bert_large_ner提高ORG实体的边界识别能力(一)

使用wikier数据集对hugging face的bert-large-ner模型进行微调,提高ner模型的准确率和泛化能力,这里数据集使用了IOB标注,需要进行BIO格式的标签统一。

2024-07-15 17:32:52 906

原创 NLTK库的安装:nltk.download()失败后如何手动下载语料库

NLTK库的安装:nltk.download()失败后如何手动下载语料库

2024-02-03 15:54:51 2054 1

原创 【anaconda报错】CondaSSLError: OpenSSL appears to be unavailable on this machine.问题记录与解决方法

【anaconda报错】CondaSSLError: OpenSSL appears to be unavailable on this machine.问题记录与解决方法

2024-02-03 15:26:22 6076 19

原创 读取IOB标注数据,并转化为BIO标注格式(二)

上一章详细解释了BIO和IOB数据标注的区别,并且对转化步骤做了详细说明。这一章以wikierNER数据集为例,展示读取IOB标注数据,并将其转化为BIO标注格式相关代码。

2024-01-03 18:43:28 629 1

原创 读取IOB标注数据,并转化为BIO标注格式(一)

BIO标注方法和IOB标注方法是用于命名实体识别(Named Entity Recognition,NER)任务的常用标注方法。以下代码可以读取IOB标注数据,并将其转化为BIO标注格式。

2024-01-03 18:18:23 1157 1

原创 GlobalAveragePooling2D层和Flatten层

GlobalAveragePooling2D层是一种全局平均池化层,在该层中,每个特征图的特征被计算出来后,通过对每个特征图取平均值得到一个标量特征。这样,无论输入图像的尺寸大小如何变化,最终得到的特征都是固定长度的。相比较Flatten层,GlobalAveragePooling2D层会保留更少的特征信息,但减少了参数量和计算量。它可以将每个像素都看作是独立的特征,将二维或多维的图像特征转换为一维特征表示。Flatten层保留了更多的特征信息,但会增加模型的参数数量。

2023-09-18 15:51:44 637

原创 微调T5构建英文摘要模型

使用transformers的t5模型做英文摘要,并进行模型微调

2023-08-09 21:00:00 1201 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除