Automatic Prompt Augmentation and Selection with Chain-of-Thought from Labeled Data
最新推荐文章于 2025-12-13 20:54:04 发布
研究者利用链式思维(CoT)样例,通过few-shot推理生成新样例或零Shot-CoT,构建随机分布进行样本选择。采用强化学习优化这一过程,实验结果显示在各数据集上达到最新最优性能(SOTA)。


1114

被折叠的 条评论
为什么被折叠?



