论文重点记录《RACONTEUR: A Knowledgeable, Insightful, and Portable LLM-Powered Shell Command Explainer》

重点

Raconteur用如下方法做了一个垂直细分领域的LLM用于解释shell命令

(1)基于公开数据集,利用GPT3.5+Prompt构造了高质量的微调数据集,在4块A100 (80GB)对ChatGLM2-6B进行微调,微调后能力超越GPT4;

(2)微调了Text2Vec模型E5Large(embedding): 命令行为描述到TTP之间的转换;

(3)微调了Text2Vec模型E5Large,做语义检索:命令到doc之间的查找。

目前没有看到开源代码&数据

思考

如下点值得参考

  1. 如何构造垂直领域高质量数据集

    • 思路上主要是:收集不同开源数据,用GPT做augmentation等处理
      在这里插入图片描述
  2. 一些关系转换可以用embedding模型实现(相似性检索)

    • 比如 text to TTP

在这里插入图片描述

参考

  1. https://raconteur-ndss.github.io/#
  2. 论文:https://arxiv.org/pdf/2409.02074
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值