自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 每日一篇小论文 ---- DNN Embeddings with Gating Mechanisms for Text-Independent Speaker Verification

@每日一篇小论文----arXiv:1903.12092v2DNN Embeddings with Gate Mechanism在本文中,门控机制应用于基于x-vector的文本独立说话人验证的深度神经网络(DNN)训练。 首先,采用门控卷积神经网络(GCNN)对帧级嵌入层进行建模。 与时延DNN(TDNN)相比,GCNN可以通过精心设计的存储单元和门控机制获得更具表现力的帧级表示。 此外,我...

2019-04-26 09:35:25 454

原创 每日一篇小论文 ---- Attentive Statistics Pooling for Deep Speaker Embedding

@每日一篇小论文----arXiv:1803.10963v2attentive statistic pooling本文提出了在与文本无关的说话人验证中深度说话人嵌入的细心统计汇总。 在传统的扬声器嵌入中,帧级特征在单个话语的所有帧上被平均以形成话语级特征。 我们的方法利用注意机制为不同的帧提供不同的权重,并且不仅生成加权平均值而且生成加权标准偏差。 通过这种方式,它可以更有效地捕捉扬声器特性的...

2019-04-25 09:28:35 4933 4

原创 每日一篇小论文 ---- TEXT-INDEPENDENT SPEAKER VERIFICATION USING 3D CONVOLUTIONAL NEURAL NETWORKS

@每日一篇小论文----arXiv:1705.09422v7三维卷积在本文中,已经提出了一种使用3D卷积神经网络(3D-CNN)架构的新方法,用于与文本无关的设置中的说话人验证。主要挑战之一是创建speaker model。大多数先前报道的方法基于对从扬声器的发声中提取的特征求平均来创建说话者模型,其被称为d-vector系统。在我们的论文中,我们提出了一种自适应特征学习,它利用3D-CNN进...

2019-04-24 08:25:11 1090

原创 每日一篇小论文 ---- Weight Normalization

@每日一篇小论文----arXiv:1602.07868v3Weight Normalization我们提出权重归一化:神经网络中权重向量的重新参数化,将那些权重向量的长度与它们的方向分离。通过以这种方式重新参数化,我们改进了优化问题的条件,并加快了随机梯度下降的收敛速度。我们的重新参数化受到批量标准化的启发,但不会在批处理中的示例之间引入任何依赖关系。这意味着我们的方法也可以成功地应用于诸如...

2019-04-23 09:37:05 1609

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除