19、微调大语言模型以回答带代码片段的编程问题

微调大语言模型以回答带代码片段的编程问题

1. 引言

现代自然语言处理(NLP)广泛使用大语言模型(LLMs),这些模型通过预训练隐式地从文本中提取知识,然后可以在不访问任何外部上下文或知识的情况下执行开放域问答(QA)。对于非常大的模型,如GPT - 3,这种方法甚至可以在不进行任何微调的情况下,在开放域QA上取得与基于检索的方法相竞争的结果。

最近,Codex在程序合成方面的成功表明,预训练的LLMs可以成功地从NLP领域适应到源代码领域。然而,现实中程序员在编程相关问答网站上的问题并不局限于定义功能,这就引出了我们的研究问题:预训练的LLMs在回答现实中程序员的问题(即使是用代码片段回答的问题)时效果如何?

2. 数据集

我们关注具有以下属性的编程相关问答数据:
- “API使用”类问题。
- 问题由简短的文本描述(≤200字符)组成,且不包含显式的源代码。
- 答案包含显式的代码片段,为问题提供解决方案。
- 研究主要集中在Python这一流行的编程语言。

2.1 CoNaLa数据集

这是一个现有的公开数据集,包含2879个示例,其中训练集有2379个,测试集有500个。该数据集是从Stack Overflow爬取并经过人工注释整理的。

2.2 自定义Stack Overflow数据集

基于原始的公开Stack Overflow数据准备。具体操作步骤如下:
1. 选择带有“Python”标签的问题,并仅使用标题文本作为问题。
2. 根据Stack Overflow数据选择得分最高的答案作为真实答案。 <

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值