Bert实战

最新推荐文章于 2025-03-11 12:27:20 发布

我是斯托克斯

最新推荐文章于 2025-03-11 12:27:20 发布

阅读量1.8k

点赞数 37

文章标签： bert 人工智能深度学习

本文链接：https://blog.youkuaiyun.com/m0_69326538/article/details/145159669

版权

一、data.py

这些函数主要用于处理和加载数据集，以便在机器学习或深度学习任务中使用。具体来说，它们的职责如下：

read_file 函数：
- 读取指定路径的文件，通常是一个以逗号分隔的CSV文件。
- 跳过文件的第一行（通常是标题行）。
- 将每一行按照逗号分割，提取出数据和标签。
- 将数据和标签分别存储在两个列表中。
- 打印读取的数据条数。
- 返回数据和标签列表。
jdDataset 类：
- 这是一个自定义的数据集类，继承自Dataset类，用于在PyTorch中处理数据。
- 在初始化时，接收数据和标签，并将标签转换为PyTorch的LongTensor类型。
- 实现__getitem__方法，用于通过索引获取数据和标签。
- 实现__len__方法，返回数据集的大小。
get_data_loader 函数：
- 接收文件路径、批量大小以及验证集比例（默认为0.2）。
- 调用read_file函数读取数据。
- 使用train_test_split函数将数据分为训练集和验证集，同时保持标签的分布。
- 创建jdDataset类的实例，分别用于训练集和验证集。
- 使用DataLoader类创建训练集和验证集的数据加载器，这些加载器会在训练过程中批量提供数据，并且可以指定是否打乱数据顺序。

总的来说，这些函数和类的组合使得从文件中读取数据、划分数据集、创建数据加载器的过程变得更加方便，便于后续在PyTorch中进行模型的训练和验证。

这段代码定义了一个名为myBertModel的PyTorch模块，它是一个基于BERT（Bidirectional Encoder Representations from Transformers）的模型，用于文本分类任务。以下是该类的功能和各个部分的作用：

这个模型的工作流程大致如下：

这个模型可以用于各种文本分类任务，例如情感分析、主题分类等。在训练过程中，你需要提供一个包含文本和对应标签的数据集，并使用适当的损失函数和优化器来调整模型参数。

BERT（Bidirectional Encoder Representations from Transformers）模型架构是基于Transformer的编码器结构。以下是BERT模型的主要组成部分和其架构的特点：

Embedding Layer:
- Token Embeddings: 为每个词分配一个向量。
- Segment Embeddings: 为不同句子片段（例如，句子A和句子B）分配不同的向量。
- Positional Embeddings: 为句子中的每个词分配一个位置向量，以保留词序信息。
- 这些嵌入会被相加，形成最终的输入表示。
Transformer Encoder:
- 由多个相同的层堆叠而成，通常BERT使用的是Transformer的“Encoder”部分。
- 每个层包含两个子层：多头自注意力（Multi-Head Self-Attention）和位置全连接前馈网络（Position-wise Feed-Forward Networks）。
- 每个子层周围都有残差连接，后接层归一化（Layer Normalization）。
输出层:
- 对于预训练任务（如掩码语言建模和下一句预测），BERT模型的输出层会有特定的结构。
- 在微调任务中，通常会添加一个或多个线性层来生成最终的输出（例如，分类任务的类别预测）。

双向性 (Bidirectional): BERT是双向的，这意味着它同时考虑了输入序列中每个词的左右上下文。
多层堆叠 (Multi-layer): BERT通常有多个Transformer编码器层堆叠在一起（例如，BERT-Base有12层，BERT-Large有24层）。
多头注意力 (Multi-Head Attention): 在Transformer编码器层中，多头注意力机制允许模型在不同的表示子空间中并行地学习信息。
预训练任务:
- 掩码语言模型 (Masked Language Model, MLM): 随机掩盖输入序列中的一些词，并要求模型预测这些词。
- 下一句预测 (Next Sentence Prediction, NSP): 给定两个句子A和B，模型需要预测B是否是A的下一句。

BERT模型因其强大的表示能力和在多种NLP任务中的优异表现而广受欢迎。在微调阶段，可以根据具体任务的需要对BERT模型进行微调，例如通过添加额外的输出层来实现分类、命名实体识别等任务。

这个函数train_val用于训练和验证一个深度学习模型，具体来说，它执行以下步骤：