(书接上文) 7. 训练阶段样本规模变化 7.1 生成响应阶段 在generate_responses函数中,prompt和response的对应关系是: N个prompts → N个responses 具体来说: 输入:batch_size个prompts(例如64个) 输出:batch_size个responses(每个prompt生成1个response) 示例代码: # 准备一批prompts batch_size = 64 prompts = dataset.sample(batch_size