WhisperWriter 使用教程

WhisperWriter 使用教程

whisper-writer 💬📝 A small dictation app using OpenAI's Whisper speech recognition model. whisper-writer 项目地址: https://gitcode.com/gh_mirrors/wh/whisper-writer

1. 项目目录结构及介绍

WhisperWriter 的项目目录结构如下:

whisper-writer/
├── assets/                    # 存放静态资源
├── src/                       # 源代码目录
│   ├── __init__.py
│   ├── app.py                 # 主应用程序文件
│   ├── config.py              # 配置文件
│   ├── recorder.py            # 录音模块
│   ├── transcriber.py         # 转录模块
│   └── utils.py               # 辅助工具模块
├── .gitignore                 # Git 忽略文件
├── CHANGELOG.md               # 更新日志
├── LICENSE                    # 许可证文件
├── README.md                  # 项目说明文件
├── requirements.txt           # 项目依赖文件
└── run.py                     # 项目启动文件
  • assets/:存放项目的静态资源,如图片、样式表等。
  • src/:包含项目的所有源代码。
    • app.py:主应用程序文件,负责应用程序的主要逻辑。
    • config.py:配置文件,包含应用程序的所有配置选项。
    • recorder.py:录音模块,负责录音功能。
    • transcriber.py:转录模块,负责语音到文本的转换。
    • utils.py:辅助工具模块,包含一些工具函数。
  • .gitignore:指定 Git 忽略的文件和目录。
  • CHANGELOG.md:记录项目的更新日志。
  • LICENSE:项目使用的许可证信息。
  • README.md:项目的说明文件,包含项目的介绍和如何使用。
  • requirements.txt:项目依赖的 Python 包列表。
  • run.py:项目的启动文件,用于启动应用程序。

2. 项目的启动文件介绍

项目的启动文件是 run.py。这个文件负责初始化和启动 WhisperWriter 应用程序。以下是 run.py 的主要部分:

import sys
from PyQt5.QtWidgets import QApplication
from src.app import WhisperWriterApp

if __name__ == '__main__':
    app = QApplication(sys.argv)
    window = WhisperWriterApp()
    window.show()
    sys.exit(app.exec_())

这段代码首先导入必要的模块,然后创建一个 QApplication 对象。之后,创建 WhisperWriterApp 类的实例,并显示窗口。最后,进入应用程序的主事件循环。

3. 项目的配置文件介绍

项目的配置文件是 config.py。这个文件包含了应用程序的所有配置选项,如 API 密钥、模型设置、语言设置等。以下是 config.py 的主要配置:

# 开发者模式开关
DEBUG = True

# OpenAI API 配置
API_KEY = 'your_openai_api_key'
BASE_URL = 'https://api.openai.com/v1'

# Whisper 模型配置
MODEL = 'base'
DEVICE = 'auto'
COMPUTE_TYPE = 'default'
LANGUAGE = 'zh-CN'
TEMPERATURE = 0.0

# 录音和转录配置
ACTIVATION_KEY = 'ctrl+shift+space'
RECORD_MODE = 'continuous'
VAD_FILTER = True

配置文件中的选项可以根据实际需要进行修改,例如更改 API 密钥、选择不同的模型或设置默认的语言。这些配置将影响应用程序的行为和性能。在开发环境中,可以通过修改 DEBUG 来开启或关闭调试模式。

whisper-writer 💬📝 A small dictation app using OpenAI's Whisper speech recognition model. whisper-writer 项目地址: https://gitcode.com/gh_mirrors/wh/whisper-writer

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

基于51单片机仿真设计的零基础DIY制作表白利器—8x8LED矩阵显示(仿真电路+程序) 小圈圈、小爱心、囧字脸……只要是你想得到的,表情矩阵都能摆给你看,是不是很Cool呢~如果你不幸见到心仪的女孩就舌头打结,不妨考虑这个哦~ 现在很流行汽车表情仪(16×16的LED阵列),淘宝上,固定几个表情的(非阵列)要150左右,可以自定义表情的,16×16的要200多小300块。感觉自己DIY一个成本很低,于是先做一个8×8的表情矩阵,汽车上装着太小了,可以放在上班时候的工位上。哈哈哈。一般控制LED阵列的话,每一片8×8的阵列,使用一片max7219(约5元1片,美信公司的芯片都是很贵的)矩阵控制,或者使用两片 74HC595锁存器(约0.5元1片)。我买好了两片74HC595,不过想到一片8×8的阵列理论上应该可以直接使用一个89c51来控制(89c51有32个数据脚,arduino脚不够),仿真实验成功,省下了1块钱(2片595),哈哈。下面是成品图及我录的视频,我自己画了6个图切换。你发挥想象,可以做出更多的图来。我断断续续地在2天时间里抽时间把它做出来的(仿真实验和原理图我在N天前就已经做好了。本次DIY手工实际估算花费焊接40分钟,调试1小时)。 1 工具和材料 ○ 8x8 LED阵列,淘宝购得,单价4.7元(后来在diytrade.com上发现,一次性买32片的话,只需要0.7元一片); ○ STC89C52RC单片机一片, 淘宝购得,单价3.7元; ○ 51最小系统板一个,淘宝购得,单价3.9(此为亏本赚信用价,现在卖家已经涨价到9.9元。另有5.8元价格的,小一些,没有串口和 232芯片,做工也差一个级别。不如买9.9元的系统划算。); ○ 洞洞板一片,淘宝购得,单价0.4元; ○ 点触开关一个,淘宝购得价格0.4元(一定要买带盖子的,手感要好很多
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

左松钦Travis

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值