TRACE项目在ActivityNet-DVC数据集上的复现问题解析-优快云博客

TRACE项目在ActivityNet-DVC数据集上的复现问题解析

在使用TRACE项目复现ActivityNet-DVC数据集上的结果时，遇到了模型生成过程中的错误。主要问题出现在transformers版本兼容性和输入处理逻辑上。

最初出现的错误是由于transformers版本过高导致的函数不兼容。TRACE项目对默认函数进行了修改，新版本的transformers不再适配。经过测试，transformers 4.40.1版本能够解决初始的兼容性问题。

在解决版本问题后，又出现了新的运行时错误。具体表现为：

深入分析发现，这是由于解码阶段输入张量维度处理不当造成的。在解码过程中，input_ids的数量会逐渐增长，而原始代码没有正确处理这种增长情况。

经过多次调试，最终确定以下解决方案：

修改模型架构代码中处理输入ID的部分，确保每次处理时保持正确的张量维度。具体修改为：

cur_input_ids = input_ids[batch_idx][-1].unsqueeze(0)

这一修改通过以下方式解决问题：

对于希望复现TRACE项目结果的开发者，建议：

通过系统性地解决这些问题，开发者可以成功复现TRACE在ActivityNet-DVC数据集上的表现。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考