OptiPrompt:优化提示法在事实探针任务中的实现

OptiPrompt:优化提示法在事实探针任务中的实现

OptiPrompt OptiPrompt 项目地址: https://gitcode.com/gh_mirrors/op/OptiPrompt

项目介绍

OptiPrompt 是一个基于 PyTorch 的实现,源自论文《Factual Probing Is [MASK]: Learning vs. Learning to Recall》。该方法提出了一种简单而有效的事实探针策略——OptiPrompt,通过优化输入的密集向量来提升模型在事实性探针任务上的表现。OptiPrompt 特别地利用手动设计的模板,并且允许添加额外的密集向量以增强表示能力(当不设置手动模板初始化时)。此项目提供了在 LAMA 基准数据集上运行实验的能力,包括使用预训练的 BERT 模型以及进行微调等功能。

项目快速启动

要快速启动 OptiPrompt,确保您已安装所有必要的依赖项。可以通过以下命令安装:

pip install -r requirements.txt

之后,运行提供的示例脚本来实验 OptiPrompt,以默认配置处理 LAMA 数据集中的一种关系(例如,P101):

bash scripts/run_optiprompt.sh

如果您希望自定义设置,比如更改输出目录、使用的模型或是否启用随机初始化,需要修改脚本中的变量。

应用案例和最佳实践

运行 OptiPrompt 在特定关系上

对特定关系执行训练或评估,如 P101,您可以按如下方式操作:

rel=P101
dir=outputs/$rel
mkdir -p $dir
python code/run_optiprompt.py \
    --relation_profile relation_metainfo/LAMA_relations.jsonl \
    --relation $rel \
    --common_vocab_filename common_vocabs/common_vocab_cased.txt \
    --model_name bert-base-cased \
    --do_train \
    --train_data data/autoprompt_data/$rel/train.jsonl \
    --dev_data data/autoprompt_data/$rel/dev.jsonl \
    --do_eval \
    --test_data data/LAMA-TREx/$rel.jsonl \
    --output_dir $dir \
    --random_init none \
    --output_predictions

微调语言模型

此外,OptiPrompt 还提供了用于微调特定关系的语言模型代码。例如,针对关系 P101:

rel=P101
dir=outputs/$rel
mkdir -p $dir
python code/run_finetune.py \
    --relation_profile relation_metainfo/LAMA_relations.jsonl \
    --relation $rel \
    --common_vocab_filename common_vocabs/common_vocab_cased.txt \
    --model_name bert-base-cased \
    --do_train \
    --train_data data/autoprompt_data/$rel/train.jsonl \
    --dev_data data/autoprompt_data/$rel/dev.jsonl \
    --do_eval \
    --test_data data/LAMA-TREx/$rel.jsonl \
    --output_dir $dir

典型生态项目

虽然直接从 OptiPrompt 的上下文中没有明确的“典型生态项目”描述,但可以推断任何旨在改进语言模型事实理解能力、探针任务或者自然语言处理(NLP)中促进模型解释性的研究项目,都可视为其生态的一部分。例如,其他事实探针框架、模型微调技术或文本表示学习工具,它们可能依赖于类似的数据集和方法论来验证或比较性能。

请注意,深入理解和利用 OptiPrompt 技术,开发者和研究者们可探索 NLP 领域的广泛应用场景,包括但不限于知识图谱增强、问答系统以及基于语言的任务自动化。

OptiPrompt OptiPrompt 项目地址: https://gitcode.com/gh_mirrors/op/OptiPrompt

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孔岱怀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值