ChatdollKit 项目推荐
项目基础介绍和主要编程语言
ChatdollKit 是一个开源项目,旨在将3D模型转化为语音交互的聊天机器人。该项目主要使用 Unity 引擎进行开发,因此主要的编程语言是 C#。Unity 是一个广泛用于游戏开发和交互式内容创作的跨平台引擎,支持 Windows、Mac、Linux、iOS、Android 等多种平台。
项目核心功能
ChatdollKit 的核心功能包括:
- 生成式AI集成:支持多种大型语言模型(LLMs),如 ChatGPT、Anthropic Claude、Google Gemini Pro、Dify 等,并具备函数调用和多模态能力。
- 3D模型表情同步:能够同步语音和动作,自动控制面部表情和动画,支持眨眼和唇同步。
- 对话控制:集成语音转文字和文字转语音功能(如 OpenAI、Azure、Google、Watson、VOICEVOX 等),管理对话状态,提取意图并路由话题,支持唤醒词检测。
- 多平台兼容:兼容 Windows、Mac、Linux、iOS、Android 等 Unity 支持的平台,包括 VR、AR 和 WebGL。
项目最近更新的功能
ChatdollKit 最近更新的功能包括:
- 多AI角色对话支持:AI角色现在可以相互聊天,带来动态和引人入胜的互动体验。
- VOICEVOX 和 AivisSpeech 内联样式支持:允许动态和自主切换语音样式,丰富角色表达和适应情感细微差别。
- VRM 运行时加载改进:允许在运行时无缝切换3D模型,确保更流畅的用户体验。
- 思维链提示(Chain of Thought Prompting):引入思维链提示,提升AI角色的智商和情商。
- 模块化改进:重新组织关键组件,提高可定制性和可维护性。
- 流式语音监听器:添加 AzureStreamSpeechListener,通过实时识别语音来实现更流畅的对话。
- 外部控制支持:通过 JavaScript 控制 WebGL 构建中的 ChatdollKit Unity 应用程序,实现更无缝的交互。
- 用户定义标签支持:允许在AI响应中包含自定义标签,实现动态操作。
- 通过 Socket 进行外部控制:支持通过 Socket 通信进行外部命令控制,解锁新的使用案例,如AI Vtubers 和远程客户服务。
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考