自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 基于Transformers的文本相似度

详细介绍文本匹配和文本相似度的概念,基于transformers的解决方案,以及代码实战,代码优化等内容

2025-02-27 11:23:53 387

原创 基于Transformers的多项选择

详细介绍多项选择任务,基于transformers的解决方案,以及代码实战演练。

2025-02-26 10:51:49 702

原创 基于Transformers的机器阅读理解(Machine Reading Comprehension)

详细解释什么是机器阅读理解,基于transformers的解决方案,以及机器阅读理解的代码实战。

2025-02-19 10:59:19 1024

原创 基于Transformers的命名实体识别

详细介绍什么是命名实体识别任务,以及基于transformers的NER解决方案,并进行代码实战。

2025-02-15 09:45:56 794

原创 基于transformers的NLP解决方案

详解介绍基于transformers的NLP解决方案。以及GPU显存的优化策略。

2025-02-14 10:16:13 825

原创 transformers基础组件之Trainer

详细解释Hugging Face的trainer库的使用,以及对文本分类的代码实例进行优化。

2025-02-10 18:07:22 173

原创 transformers基础组件之Evaluate

详细讲解Hugging Face的evaluate库,以及evaluate的使用,并使用evaluate库来优化文本分类实例的代码。

2025-02-08 17:14:23 354

原创 transformers基础组件之Datasets

详细讲解huggingface的Datasets的使用,以及对文本分类代码进行改进。

2025-02-07 15:56:50 814

原创 transformers基础组件之Model

详细介绍什么是Model、Model的基本使用方法,以及一个文本分类的实例。

2025-02-05 14:50:10 339

原创 transformers基础组件之Tokenizer

介绍transformers基础组件之Tokenizer

2025-01-28 18:39:34 709

原创 transformers基础组件之pipeline

介绍什么是pipeline,以及pipeline的使用

2025-01-25 18:59:15 272

原创 预训练模型的加载,保存模型,模型的修改(迁移学习)

深度学习基础之预训练模型的加载,保存模型,模型的修改

2025-01-24 18:33:44 459

原创 查看模型、查看模型参数的方法(主要针对迁移学习)

深度学习基础之查看模型结构和模型参数

2025-01-24 16:12:27 1019

原创 gradio入门

Gradio 是一个 Python 库,可以快速为机器学习模型创建友好的 Web 界面。简单易用,几行代码即可创建界面支持多种输入输出类型可以快速分享和部署适合原型开发和演示快速创建演示界面展示机器学习模型创建简单的 Web 应用原型验证和测试通过这些基础知识,你已经可以创建实用的交互界面了。随着深入学习,你还可以探索更多高级功能,如自定义主题、API集成等。

2024-12-31 22:08:37 1001

原创 第一章:计算机系统的概要

《Linux是怎样工作的》第一章:计算机系统的概要

2024-11-25 13:09:32 246

原创 load_dataset()的使用

load_dataset()的快速入门

2024-10-29 18:22:55 1185

原创 glob()的用法

快速上手glob()的作用、如何使用以及参数的含义

2024-10-29 14:18:57 393

原创 bert文本分类任务单卡训练VS使用deepspeed框架进行多卡训练(自用、未完结)

在上面三个文件的基础上,再加上一个多机器的配置文件(假设文件名为abc),文件内写上机器的ip地址,以及可用的显卡数量。2.2 需要准备的三部分文件:1.项目文件(例如:main.py)2.deepspeed的配置文件(deepspeed.json)3.运行deepspeed的脚本文件。其次,还要修改脚本文件(run.sh)中的内容,让它识别到多机器的配置文件。2.3.1 使用deepspeed前后,项目文件中部分代码的区别。三:使用deepspeed进行多机多卡的配置。2.4 脚本文件的编写。

2024-10-29 13:49:55 936

原创 参数解析包agrparse

解释python的argparse库的基本使用

2024-09-01 16:23:28 372

原创 bert的输出(自用,更新)

记录bert的输出格式

2024-08-30 16:21:14 504

原创 tokenizer(自用,更新)

解释tokenizer.encode()的用法,以及参数的含义

2024-08-30 15:03:59 347

原创 元学习笔记(自用,更新)

元学习分为训练阶段和测试阶段。假设我们在训练阶段有10个类别的点C1-C10,每个类别有30个标注的结点。如果支持集设置5 way 5 shot,查询集设置为5 way 15 shot。那么从10个类别中随机挑选出5类,每类挑选20个结点,组成一个task。其中每类的5个结点组成support set,剩下的15个结点组成query set。MAML的输入是一个个的task,并不是一条条的数据,这与常见的机器学习和深度学习模型是不同的。这里的N是用于分类的类别数量。K为每个类别的数据量(用于训练)

2024-08-30 14:54:17 155

原创 deepspeed的使用demo(自用、更新)

deepspeed的demo框架

2024-08-30 14:13:09 504

原创 常用的网站链接(更新)

CUDA的下载链接:

2024-06-14 21:57:48 120

原创 常见命令(更新)

设置搜索是显示通道地址。这个命令的作用是在使用conda进行包管理操作(如安装、更新等)时,显示每个包的来源URL。这样可以让用户知道这些包是从哪个源下载的。要使用特定版本的 Python 创建环境。添加channel(清华源)删除当前conda配置的源。查看当前conda配置。

2024-06-14 18:04:53 180

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除