探索AI语音吸引力:韵律因素与系统优化
1. ChatGPT语音的独特魅力
ChatGPT的语音具有“呼吸声”,且语句间停顿不同,语速不均,与真实人类的语音模式极为相似。研究发现,有较高语音吸引力的ChatGPT语音,在预测面部吸引力方面得分也最高。这表明用户对AI语音的预期形象与其语音吸引力相符,更具吸引力的语音会让人们在心理上为其塑造更理想的形象,从而更愿意与这类智能助手进行交互。
2. AI语音功率谱比较
通过对AI语音功率谱的研究,发现ChatGPT语音带宽约为12kHz,对应采样率约24kHz,能包含更丰富的频率信息,更接近人类对话。具体如下表所示:
|语音类型|带宽|采样率|
| ---- | ---- | ---- |
|ChatGPT语音|约12kHz|约24kHz|
其功率谱分布展示了语音信号在不同频率上的能量分布,水平轴代表频率,垂直轴表示声压级。这一特性使得ChatGPT语音在听觉上更加自然和真实。
3. 声学韵律参数对AI语音吸引力的影响
为了探究声学韵律参数对ChatGPT语音吸引力的影响,进行了相关实验,对语音的基频、语调、时长进行改变,让20位听众从四个维度(力量、能力、温暖、诚实)使用7点李克特量表进行主观评分。
- 基频 :采用声学中的“八度”概念按比例调整整体基频。原语音C的基频降低一个八度为Ci1,降低半个八度为Ci2,升高半个八度为Ci3,升高一个八度为Ci4。通过方差分析(ANOVA)和Tukey的HSD检验,发现基频变化在四个维度的吸引力感知上有显著差异。Ci1和Ci4与原语音相比,在吸引力感
超级会员免费看
订阅专栏 解锁全文
1125

被折叠的 条评论
为什么被折叠?



