InferSent 项目使用教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00632/article/details/146527483

InferSent 项目使用教程

InferSent InferSent sentence embeddings 项目地址: https://gitcode.com/gh_mirrors/in/InferSent

1. 项目目录结构及介绍

InferSent 是一个用于生成英语句子语义表示的开源项目。以下是项目的目录结构及其简要介绍：

InferSent/
│
├── .gitignore                # 忽略文件列表
├── CODE_OF_CONDUCT.md        # 项目行为准则
├── CONTRIBUTING.md           # 贡献指南
├── LICENSE                   # 项目许可证
├── README.md                 # 项目说明文件
├── demo.ipynb                # Jupyter Notebook 示例文件
├── extract_features.py       # 提取特征脚本
├── models.py                 # 模型定义脚本
├── samples.txt               # 示例文本文件
├── encoder/                  # 模型存储目录
│   ├── infersent1.pkl        # 使用 GloVe 向量训练的模型文件
│   └── infersent2.pkl        # 使用 fastText 向量训练的模型文件
└── ...

2. 项目的启动文件介绍

项目的启动主要是通过 Python 脚本 extract_features.py 和 Jupyter Notebook 文件 demo.ipynb 进行。以下是启动文件的简要介绍：

extract_features.py: 这个脚本用于从预训练的模型中提取句子特征。需要提供句子列表以及模型参数，调用模型进行特征提取。
demo.ipynb: 这是一个 Jupyter Notebook 文件，提供了一个实际操作的示例，包括如何加载预训练模型、设置词汇表、编码句子以及可视化句子中每个词的重要性。

3. 项目的配置文件介绍

InferSent 项目中的配置主要是通过修改 Python 脚本中的参数进行。以下是主要的配置介绍：

模型参数配置：在 models.py 或 Notebook 文件中，可以通过字典 params_model 来配置模型的参数，如批次大小、词向量维度、LSTM 隐藏层维度、池化类型等。
```
params_model = {
    'bsize': 64,
    'word_emb_dim': 300,
    'enc_lstm_dim': 2048,
    'pool_type': 'max',
    'dpout_model': 0.0,
    'version': V
}
```
词向量路径配置：在加载模型前，需要设置词向量路径 W2V_PATH，指向下载的 GloVe 或 fastText 向量文件。
```
W2V_PATH = 'fastText/crawl-300d-2M.vec'
```
词汇表构建配置：在 extract_features.py 或 Notebook 文件中，可以使用 build_vocab 方法来构建词汇表，可以选择对输入句子进行分词。
```
infersent.build_vocab(sentences, tokenize=True)
```