文章目录
前言
2025年4月10日,尝试 windows 本地部署 语音转文字(ASR) ,记录步骤及问题。
FunASR:https://github.com/modelscope/FunASR/blob/main/README_zh.md
实践
根据这篇文章:
FunASR Windows本地部署(语音转文字)https://www.bilibili.com/opus/940576448899448928
于 2025年4月10日 进行实操,步骤上没有问题。
路径问题
注意,最后要识别的 wav 路径,在 windows 上有问题
res = model.generate(input=f"要识别的wav文件路径",<---如:f"E:\asr_data\asr_example.wav",是错误的
batch_size_s=300,
hotword='魔搭')
首先会报错,TypeError: expected Tensor as element 1 in argument 0, but got str
https://github.com/modelscope/FunASR/issues/1327#issuecomment-2219473422 中的回答:
window电脑的路径问题
https://developer.aliyun.com/ask/620792 中的回答:
简单的设置一个断点,你就知道原因了,wav路径不对,建议遇到问题,多debug。
查询后都说是路径问题,可是在文件夹中明明没问题能打开。
此时对python一窍不通,还不会调试,甚至写文件都是notepad。 -_-||
搜索关键字:“python 读取文件路径”
Python读取文件相对路径理解以及文件读取路径格式 https://blog.youkuaiyun.com/JLwwfs/article/details/129276897
Windows下的文件路径使用“\”来分隔。
python程序导入数据文件时,由于python语言中反斜杠“\”是转义符,例如“\n”表示回车、“\t”表示制表符等,因此如果继续用“\”表示文件路径,会产生歧义。
解决办法如下:
使用斜杆"/“,如 “C:/test.py”
使用反斜杠符号转义,如 “C:\\test.py”
使用python的raw string,表示不需要转义,如 r"C:\test.py”
遂改为
res = model.generate(input=r"E:\asr_data\asr_example.wav",
batch_size_s=300,
hotword='魔搭')
测试用 wav 文件
官方Git提供的中文测试音频: https://isv-data.oss-cn-hangzhou.aliyuncs.com/ics/MaaS/ASR/test_audio/vad_example.wav
语音识别测试wav数据集(中文250条英文150条):https://gitcode.com/open-source-toolkit/c7508
1935

被折叠的 条评论
为什么被折叠?



