Datawhale AI夏令营全球AI攻防挑战赛（语音生成方向）Task2

原创于 2025-08-10 23:20:47 发布 · 230 阅读

CC 4.0 BY-SA版权

文章标签：

部署运行你感兴趣的模型镜像

跟着Task2过了一遍baseline，发现baseline中生成语音的部分是直接调用F5-TTS模型进行语音生成，并没有对模型进行微调等操作。且代码中if的判断条件使得从第10条之后的所有语音，都是infer_cli_basic.wav的复制结果，并没有调用模型进行语音生成。因此最终的得分也只有33.12分。

for row in task.iterrows():
    if row[1].utt < 10:
        subprocess.check_output(
            f'f5-tts_infer-cli --model F5TTS_v1_Base --ref_audio "./aigc_speech_generation_tasks/{row[1].reference_speech}" --gen_text "{row[1].text}"',
            shell=True
        )
    shutil.copy("tests/infer_cli_basic.wav", "result/" + str(row[1].utt) + ".wav")

您可能感兴趣的与本文相关的镜像

Llama Factory

模型微调

LLama-Factory

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调

Datawhale AI夏令营 全球AI攻防挑战赛（语音生成方向）Task2

Datawhale AI夏令营全球AI攻防挑战赛（语音生成方向）Task2