
论文翻译
落雪snowflake
未来的博士!正在努力申请英国Phd!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Non-linear PLDA for i-Vector Speaker Verification
翻译 2018-11-09 16:58:42 · 316 阅读 · 0 评论 -
深度说话人嵌入关于注意力模型中的统计池
Attentive Statistics Pooling for Deep Speaker Embedding 摘要本文提出了在与文本无关的说话人验证中深度说话人嵌入的细心统计汇总。在传统的扬声器嵌入中,帧级特征被用于单个话语的所有帧以形成话语级特征。我们的方法利用注意机制为不同的帧提供不同的权重,不仅生成加权平均值,还生成加权标准差。通过这种方式,它可以更有效地捕捉说话人特征的长期变...翻译 2018-11-22 18:18:13 · 2990 阅读 · 0 评论 -
集成演示攻击检测和自动扬声器验证:常见功能和高斯后端融合
Integrated Presentation Attack Detection and Automatic Speaker Verification: Common Features and Gaussian Back-end Fusion集成演示攻击检测和自动扬声器验证:常见功能和高斯后端融合使用第2节中描述的四个前端进行实验,使用预处理和后处理,包括添加对...翻译 2018-11-17 18:50:55 · 495 阅读 · 0 评论 -
利用CNN学习声信号系统与原始信号相关的说话人判别信息
On Learning Vocal Tract System Related Speaker Discriminative Information from Raw Signal Using CNNs翻译 2018-11-17 19:36:31 · 552 阅读 · 0 评论 -
VoxCeleb2:深度说话人识别
VoxCeleb2: Deep Speaker RecognitionJoon Son Chung†, Arsha Nagrani†, Andrew ZissermanVisual Geometry Group, Department of Engineering Science, University of Oxford, UK{joon,arsha,az}@robots.ox.ac...翻译 2018-11-17 20:08:06 · 5827 阅读 · 3 评论 -
监督的i-矢量建模 - 理论与应用
Supervised i-vector Modeling - Theory and Applications ...翻译 2018-11-17 20:45:04 · 201 阅读 · 0 评论 -
声纹识别的语言依赖前端分析
Analysis of Language Dependent Front-End for Speaker Recognition声纹识别的语言依赖前端分析摘要在基于深度神经网络(DNN)i-vector的说话人识别系统中,训练用于自动语音识别的声学模型。基于DNN的声学模型通常使用像英语这样资源充足的语言进行训练。在登记和测试数据不是英语的评估条件下,如在NIST SRE 2016数据...翻译 2018-11-18 15:46:52 · 718 阅读 · 0 评论 -
用于重尾PLDA的快变分贝叶斯应用于i-vector和x-vector
Fast variational Bayes for heavy-tailed PLDA applied to i-vectors and x-vectors最小发散增强导致更快的收敛和良好校准的最终结果。再次,pos-三次精度B¯i是可相互对角化的,每次迭代只需要对B0进行单个本征分析。的培训和评分算法,该模型的开放源代码实现,可在github.com/b...翻译 2018-11-18 16:34:23 · 997 阅读 · 0 评论 -
端到端说话人验证系统中长度归一化的分析
Analysis of Length Normalization in End-to-End Speaker Verification System端到端说话人验证系统中长度归一化的分析摘要经典的i-vector和最新的端到端深度说话人嵌入是自动说话者验证系统中话语级表示的两个代表性类别。传统上,一旦提取了i-vector或深度说话人嵌入,我们依靠额外的长度归一化步骤来在后端建模之前将...翻译 2018-11-26 19:45:06 · 1701 阅读 · 0 评论 -
基于原始波形的端到端DNN中避免说话人过拟合的文本无关说话人验证
Avoiding Speaker Overfitting in End-to-End DNNs using Raw Waveform for Text-Independent Speaker Verification 基于原始波形的端到端DNN中避免说话人过拟合的文本无关说话人验证Avoiding Speaker Overfitting in End-to-End DNNs using...翻译 2018-12-04 18:44:37 · 721 阅读 · 1 评论 -
基于条件生成对抗网络的I-向量变换在短说话人验证中的应用
I-vector Transformation Using Conditional Generative Adversarial Networks for Short Utterance Speaker Verification基于条件生成对抗网络的I-向量变换在短说话人验证中的应用用于短话语说话人验证的条件生成对抗网络的I向量变换 摘要 基于I向量的文本无关说话人验证(S...翻译 2018-12-04 20:00:00 · 777 阅读 · 0 评论 -
MTGAN:通过多任务三元生成对抗性网络对说话人进行验证
MTGAN: Speaker Verification through Multitasking Triplet Generative Adversarial NetworksMTGAN:通过多任务三元生成对抗性网络对说话人进行验证摘要在本文中,我们提出了一种增强的三元组方法,它通过联合利用生成对抗机制和多任务优化来改进嵌入的编码过程。 我们扩展了具有生成性对抗网络(GAN)和soft...翻译 2018-11-27 19:10:13 · 1574 阅读 · 0 评论 -
扬声器嵌入框架中的互补信息源分析
扬声器嵌入框架中的互补信息源分析Analysis of Complementary Information Sources in the Speaker Embeddings FrameworkMahesh Kumar Nandwana,Mitchell McLaren,Diego Castan,Julien van Hout,Aaron Lawson美国加利福尼亚州门洛帕克SRI国际语...翻译 2018-12-01 20:31:29 · 189 阅读 · 0 评论 -
WAV2LETTER ++:最快的开源语音识别系统
WAV2LETTER++: THE FASTEST OPEN-SOURCE SPEECH RECOGNITION SYSTEMVineel Pratap,Awni Hannun,徐连通,Jeff Cai,Jacob Kahn,Gabriel Synnaeve,Vitaliy Liptchinsky,Ronan Collobert Facebook人工智能研究摘要本文介绍了最快的...翻译 2018-12-24 15:53:33 · 4051 阅读 · 1 评论 -
用于I-Vector空间中说话人验证的余弦度量学习
Cosine Metric Learning for Speaker Verification in the i-Vector Space翻译 2018-11-16 18:41:56 · 530 阅读 · 0 评论 -
使用Mises-Fisher混合器实现自然音频流的鲁棒说话人聚类
Robust Speaker Clustering using Mixtures of von Mises-Fisher Distributions for Naturalistic Audio Streams使用Mises-Fisher混合器实现自然音频流的鲁棒说话人聚类 使用Mises-Fisher混合器实现自然音频流的鲁棒说话人聚类摘要 演讲者Diarization(...翻译 2018-11-20 16:17:17 · 540 阅读 · 0 评论 -
Co-whitening of i-vectors for short and long duration speaker verification用于短期和长期说话者验证的i向量的共同白化
Co-whitening of i-vectors for short and long duration speaker verification论文翻译用于短期和长期说话者验证的i向量的共同白化摘要 I-vector是语音话语的固定长度和低等级表示。它已广泛用于与文本无关的说话人验证。理想情况下,来自同一说话者的语音话语将映射到唯一的i-vectors。但是,由于某些内在和外在...翻译 2018-11-07 14:23:06 · 458 阅读 · 0 评论 -
关于联合唤醒词检测和文本相关说话人验证的卷积LSTM建模
On Convolutional LSTM Modeling for Joint Wake-Word Detection and Text Dependent Speaker Verification业务,公司,政府,百万,早晨,十九和一千个被选中,并且形成了包含所考虑的每个关键词的记录的子数据集。每个子数据集的规格列于表中。这里,提到的说话人验证任务的测试数据...翻译 2018-11-10 17:33:44 · 778 阅读 · 0 评论 -
利用说话人嵌入实现混响环境下远距离语音的鲁棒说话人识别
Robust Speaker Recognition from Distant Speech under Real Reverberant Environments Using Speaker Embeddings3.演讲者识别系统在本节中,我们将描述为我们的实验开发的说话人识别系统。我们使用三种不同的说话人识别系统,包括传统的基于UBM i-vector的系统,基于DNN...翻译 2018-11-11 16:18:09 · 817 阅读 · 0 评论 -
随机数字串式说话人验证深度瓶颈特征的潜在因素分析
Latent Factor Analysis of Deep Bottleneck Features for Speaker Verification with Random Digit Strings翻译 2018-11-11 17:22:30 · 328 阅读 · 0 评论 -
深度神经网络,适用于小型脚本文本相关的语音验证
DEEP NEURAL NETWORKS FOR SMALL FOOTPRINT TEXT-DEPENDENT SPEAKER VERIFICATIONd-ivector系统优于i-ivector系统。我们还尝试了DNN培训的不同配置。如果没有maxout和dropout技术,训练有素的DNN的EER绝对差2%左右。在隐藏层中将节点数量增加到512并没有太大帮助,而...翻译 2018-11-11 18:31:09 · 410 阅读 · 0 评论 -
PLDA对说话人身份与多重滋扰条件联合建模的推广
A Generalization of PLDA for Joint Modeling of Speaker Identity and Multiple Nuisance Conditions PLDA对说话人身份与多重滋扰条件联合建模的推广uciana Ferrer1,Mitchell McLaren21Incituto de Investigacio'n en Ciencias...翻译 2018-11-13 20:12:14 · 310 阅读 · 0 评论 -
LOCUST - 用于说话人验证的纵向语料库和工具集
LOCUST - Longitudinal Corpus and Toolset for Speaker Verification摘要在本文中,我们提出了一个新的纵向语料库和工具集,以努力解决语音老化对说话人验证的影响。我们已经检查过以前对年龄相关语音变化的纵向研究以及它对现实世界用例的适用性。我们的研究结果表明,科学家们将与年龄相关的语音变化视为一种障碍,而不是利用身份验证者的优势。...翻译 2018-11-13 20:34:23 · 553 阅读 · 0 评论 -
一种用回归神经网络学习说话人嵌入的无监督神经网络预测框架
An Unsupervised Neural Prediction Framework for Learning Speaker Embeddings using Recurrent Neural Networks一种用回归神经网络学习说话人嵌入的无监督神经网络预测框架摘要本文提出了一种无监督的训练框架,用于使用神经预测编码(NPC)技术学习特定于说话者的嵌入。我们采用回归神经网络(R...翻译 2018-11-13 21:05:35 · 472 阅读 · 0 评论 -
用于说话人验证的非线性i-vectors的研究
An Investigation of Non-linear i-vectors for speaker verification文章地址https://www.isca-speech.org/archive/Interspeech_2018/pdfs/2474.pdf陈南新,Jesu的Villalba,Najim Dehak语言和语音处理中心约翰霍普金斯大学,马里兰州巴尔的摩{b...翻译 2018-11-08 19:49:55 · 710 阅读 · 0 评论 -
学习说话人识别和验证的判别特征
Learning Discriminative Features for Speaker Identification and Verification学习说话人识别和验证的判别特征摘要任何文本独立的说话者识别和/或验证系统的成功依赖于系统学习辨别特征的能力。在本文中,我们提出了一种基于流行的非常深VGG [1] CNN的卷积神经网络(CNN)架构,通过关键修改来适应可变长度频谱图...翻译 2018-11-15 19:37:21 · 1669 阅读 · 0 评论 -
基于深度神经网络的说话人嵌入式端到端扬声器验证
DEEP NEURAL NETWORK-BASED SPEAKER EMBEDDINGS FOR END-TO-END SPEAKER VERIFICATION基于深度神经网络的说话人嵌入式端到端扬声器验证 David Snyder *,Pegah Ghahremani,Daniel Povey,Daniel Garcia-Romero,Yishay Carmiel,Sanjeev K...翻译 2018-11-14 10:48:08 · 651 阅读 · 1 评论 -
在与文本无关的说话人识别中补偿域不匹配
Compensation for domain mismatch in text-independent speaker recognition翻译 2018-11-14 13:20:18 · 270 阅读 · 0 评论 -
用于文本相关说话人验证的J-Vector提取器和联合贝叶斯模型的联合学习
Joint Learning of J-Vector Extractor and Joint Bayesian Model for Text Dependent Speaker VerificationZiqiang Shi, Liu Liu, Huibin Lin, Rujie Liu用于文本相关说话人验证的J-Vector提取器和联合贝叶斯模型的联合学习施自强,刘柳,林惠彬,刘如杰...翻译 2018-11-14 14:24:05 · 749 阅读 · 0 评论 -
说话人识别的带宽扩展研究
Investigation on Bandwidth Extension for Speaker Recognition翻译 2018-11-20 15:34:48 · 396 阅读 · 0 评论 -
如何使用glob递归查找文件翻译
This is what I have:glob(os.path.join('src','*.c'))but I want to search the subfolders of src. Something like this would work:glob(os.path.join('src','*.c'))glob(os.path.join('src','*','*.c')...翻译 2019-05-18 20:44:06 · 1247 阅读 · 0 评论