BlahST项目语音转录脚本安装与配置指南

BlahST项目语音转录脚本安装与配置指南

BlahST Input text from speech in any Linux window, the lean, fast and accurate way, using whisper.cpp offline. Speak with local LLMs. BlahST 项目地址: https://gitcode.com/gh_mirrors/bl/BlahST

项目背景

BlahST是一个开源的语音转录工具集,主要包含wsi和wsiml等脚本工具,能够实现实时语音录制和转录功能。该项目支持本地whisper.cpp部署和whisperfile轻量级方案,适用于Linux桌面环境。

核心组件解析

1. 主要脚本功能

  • wsi:基础语音转录脚本
  • wsiml:支持多语言转录的扩展版本
  • wsiAI:集成llama.cpp/llamafile的AI增强版本

2. 依赖组件

  • sox:音频录制工具
  • whisper.cpp/whisperfile:语音识别引擎
  • xsel/wl-copy:剪贴板管理工具
  • xdotool(可选):自动粘贴功能支持

安装过程详解

标准安装流程

  1. 执行安装脚本:bash install-wsi
  2. 脚本会自动:
    • 创建~/.local/bin目录
    • 复制执行脚本到目标路径
    • 检查sox等依赖项

配置选项

安装过程中会提示选择识别引擎:

  • 本地whisper.cpp安装(Y)
  • 网络whisper.cpp服务(N)
  • whisperfile轻量方案(N)

常见问题解决方案

1. 路径问题

若遇到"required file not found"错误:

  • 手动检查~/.local/bin是否在PATH中
  • 确认使用完整路径执行:bash ~/.local/bin/wsi

2. 音频录制问题

当出现快速闪退时:

  • 检查/dev/shm/wfile录音文件
  • 调整麦克风灵敏度
  • 设置停止录音热键:pkill --signal 2 rec

3. 性能优化建议

  • 对于CUDA设备,建议使用编译版whisper.cpp
  • whisperfile用户可使用--recompile参数优化CUDA支持
  • 网络服务模式可获得最佳性能(约90倍实时转录速度)

高级功能配置

自动粘贴功能

编辑脚本CONFIG区块:

AUTOPASTE=true  # 启用自动粘贴

热键设置

推荐配置:

  • 开始录音:自定义全局热键
  • 停止录音:绑定到pkill --signal 2 rec

使用技巧

  1. 初次测试命令:wsi -c -w(使用剪贴板模式和whisperfile)
  2. 终端调试时可取消注释脚本中的echo语句
  3. 对于X11环境,确保安装xsel剪贴板工具
  4. 敏感麦克风需精细调整阈值参数

性能考量

  • whisperfile使用tinyblass基础CUDA实现,性能中等
  • 编译版whisper.cpp可获得最佳GPU加速
  • CPU使用率取决于模型大小和硬件配置

该项目为语音转录提供了灵活的解决方案,用户可根据硬件条件选择适合的运行模式。通过合理配置,可以实现高效的实时语音转录体验。

BlahST Input text from speech in any Linux window, the lean, fast and accurate way, using whisper.cpp offline. Speak with local LLMs. BlahST 项目地址: https://gitcode.com/gh_mirrors/bl/BlahST

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

许沙煊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值