CoT开山之作:Chain-of-Thought Prompting

CoT先驱:大型语言模型中的推理链提示技术
该论文探讨了如何通过Chain-of-ThoughtPrompting激发大规模语言模型进行推理。这种方法揭示了模型在解决问题时的思维过程,提高了其逻辑推理能力,特别是在数学和认知任务上的表现。
`zj_type` 和 `auto_cot` 是两个控制文本处理方式的参数,它们的设置取决于你使用的模型输出格式和评估目标。下面是它们的详细说明和设置建议: --- ### ✅ `zj_type` 参数说明 - **类型**:`str` - **默认值**:`"none"` - **可选值**:`"none"`, `"mix"`(或其他自定义值,视具体项目而定) - **用**:决定如何处理预测文本和真实标签文本,特别是在混合任务或多阶段输出中。 #### 示例逻辑: ```python if zj_type == 'mix': gt[i] = gt[i].replace(zj_pro_placeholder, '').replace(zj_end, '') pred[i] = pred[i].replace(zj_pro_placeholder, '').replace(zj_end, '') gt[i] = '{' + gt[i][gt[i].find("自车横纵向决策")-1:] pred[i] = '{' + pred[i][pred[i].find("自车横纵向决策")-1:] ``` #### 设置建议: | 场景 | `zj_type` 设置 | |------|----------------| | 普通纯文本输出 | `"none"` | | 包含多阶段或多任务输出(如自车决策+路径规划) | `"mix"` | | 特定格式输出(需要截取某段内容) | 自定义逻辑(如`"custom"`) | --- ### ✅ `auto_cot` 参数说明 - **类型**:`bool` - **默认值**:`False` - **用**:是否启用自动 Chain-of-ThoughtCoT)模式。若启用,表示预测文本中包含推理过程和最终答案,需要进行分隔符提取。 #### 示例逻辑: ```python if auto_cot: delimiter = prediction_data['auto_cot_delimiter'] trimmed_gt = [] for txt in gt: if delimiter in txt: trimmed_gt.append(txt[txt.find(delimiter)+len(delimiter):].replace(zj_end, '').replace(zj_pro_placeholder, '')) else: trimmed_gt.append(txt.replace(zj_end, '')) gt = trimmed_gt ``` #### 设置建议: | 场景 | `auto_cot` 设置 | |------|----------------| | 模型输出只有最终答案 | `False` | | 模型输出包含推理过程(CoT)和答案 | `True` | --- ### ✅ 推荐的组合设置 | 使用场景 | `zj_type` | `auto_cot` | 说明 | |----------|------------|-------------|------| | 纯文本输出,无CoT | `"none"` | `False` | 最基础的评估方式 | | 有推理过程(如CoT)输出 | `"none"` | `True` | 使用分隔符提取答案部分 | | 多阶段输出(如决策+路径规划) | `"mix"` | `False` | 截取特定部分进行评估 | | 多阶段输出且有CoT | `"mix"` | `True` | 同时启用两种处理方式 | --- ### ✅ 示例命令行调用方式 ```bash python evaluate.py predictions.pt mix True '[eos]' summary output_dir Pangu_x.x DriveCoT ``` 对应参数顺序: 1. `predictions_path` = `predictions.pt` 2. `zj_type` = `mix` 3. `auto_cot` = `True` 4. `zj_end` = `[eos]` 5. `save_name` = `summary` 6. (跳过第6个参数) 7. `model_name` = `Pangu_x.x` 8. `assessment_set` = `DriveCoT` --- ### ✅ 示例代码片段(根据参数处理文本) ```python if auto_cot: delimiter = prediction_data.get('auto_cot_delimiter', '---') trimmed_gt = [txt.split(delimiter)[-1].replace(zj_end, '') for txt in gt] trimmed_pred = [txt.split(delimiter)[-1].replace(zj_end, '') for txt in pred] else: trimmed_gt = [txt.replace(zj_end, '') for txt in gt] trimmed_pred = [txt.replace(zj_end, '') for txt in pred] ``` --- ### ✅ 总结 | 参数 | 推荐值 | 适用场景 | |------|--------|----------| | `zj_type` | `"none"` 或 `"mix"` | 控制文本截取方式 | | `auto_cot` | `True` 或 `False` | 是否启用推理过程提取 | --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值