WingmanAI 开源项目使用教程-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00046/article/details/137988496

WingmanAI 开源项目使用教程

WingmanAI 是一个强大的工具，用于实时转录系统音频和麦克风音频，并集成 ChatGPT 进行交互式使用。它允许用户保存、加载和追加转录内容，以便在对话中进行有效的上下文管理。WingmanAI 提供了一个独特的通信平台，通过 ChatGPT 的实时交互，增强了对话的记忆和上下文管理能力。

首先，克隆项目仓库并安装所需的依赖：

git clone https://github.com/e-johnstonn/wingmanAI.git
cd wingmanAI
pip install -r requirements.txt

如果你希望使用 CUDA 加速 Whisper 模型，请先卸载现有的 torch 并安装支持 CUDA 的版本：

pip uninstall torch
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117

将你的 OpenAI API 密钥添加到 keys.env 文件中：

echo "OPENAI_API_KEY=your_api_key_here" > keys.env

运行主程序 main.py：

python main.py

WingmanAI 可以用于实时记录和转录对话，适用于会议记录、采访记录等场景。通过 ChatGPT 的集成，可以实时分析对话内容，提供智能回复和建议。

在长时间的对话中，WingmanAI 可以保存和加载转录内容，确保对话的上下文不被丢失。这对于需要长时间跟踪对话内容的场景非常有用，例如客户支持、技术支持等。

虽然当前版本默认使用英语，但可以通过修改配置文件支持其他语言。这对于多语言环境下的对话记录非常有帮助。

WingmanAI 使用了 OpenAI 的 Whisper 语音识别模型，这是一个开源的语音识别工具，支持多种语言和方言。Whisper 的高准确性和实时性使得 WingmanAI 在语音转录方面表现出色。

ChatGPT 是 OpenAI 开发的自然语言处理模型，能够理解和生成自然语言文本。WingmanAI 通过集成 ChatGPT，实现了智能对话和上下文管理功能，提升了对话的交互性和智能性。

WingmanAI 基于 SevaSk 的 Ecoute 项目进行了修改和扩展。Ecoute 是一个实时语音转录工具，WingmanAI 在此基础上增加了 ChatGPT 集成和上下文管理功能，使其更加强大和实用。

通过以上模块的介绍，您可以快速了解 WingmanAI 项目的功能和使用方法，并根据实际需求进行应用和扩展。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考