1.下载代码和模型检查点
代码:
git clone https://github.com/ASLP-lab/OSUM.git
模型检查点:
modelscope download --model ASLP-lab/OSUM
2.安装依赖
pip3 install -r requirements.txt
3.因为我是单一文件测试,所以选择运行infer_time.py。打开代码所在位置,进入runtime,infer_runtime.py
中设置 ckpt
变量为modelscope下载的位置
原码:
checkpoint_path=***
修改后:
checkpoint_path=modelscope/hub/models/ASLP-lab/OSUM/infer.sh
更改input_wav_path和input_prompt这两个参数为自己的任务即可
批量任务参考:https://zhuanlan.zhihu.com/p/25477034949
踩坑记录:
1.AudoConfig找不到
错误信息:
File "/OSUM/OSUM_git/examples/osum/runtime/../../../wenet/llm_asr/llmasr_model.py", line 9, in <module>
from transformers import AutoModelForCausalLM, AutoTokenizer,AudoConfig
ImportError: cannot import name 'AudoConfig' from 'transformers'
原因:llmasr_model文件里没有导入AudoConfig
解决方法: