- 博客(199)
- 资源 (5)
- 收藏
- 关注
原创 梯度计算注意事项(pytorch)
使用detach函数将张量分离,再使用numpy函数注意:detach之后会产生一个新的张量,新的张量作为叶子结点,并且该张量和原来的张量共享数据,但是分离后的张量不需要计算梯度。
2024-07-16 19:28:41
162
原创 控制梯度计算(pytorch)
什么时候会用控制梯度计算了,在训练的时候模型需要梯度计算,训练完毕不需要。所以需要控制什么时候计算什么时候不计算。
2024-07-16 19:22:29
355
原创 神经网络基础--网络参数初始化(PyTorch)
网络参数初始化1.均匀分布初始化,权重参数初始化从区间均匀随机取值,即在(-1/根号d,1/根号d)均匀分布中生成当前神经元的权重,其中d为每个神经元的输入数量2.正态分布初始化,随机初始化从均值为0,标准差为1是高斯分布中取样,使用一些很小的值对参数w进行初始化。3.全0初始化,将神经网络中的所有权重初始化为04.全1初始化,将神经网络中所有权重参数初始化为1.5.固定值初始化,将神经网络中所有权重参数初始化为某个固定的值.6..kaiming初始化,也叫做HE初始化,HE初始化分为正态分布的
2024-07-16 19:20:25
485
翻译 音转|Eressive Voice Conversion: A Joint Framework for Speaker Identity and Emotional Style TransferZon
由于StarGAN在多对多语音转换方面的成功,我们扩展了这个想法,并提出了一个多对多的VC框架,它可以共同传递说话者的身份和情感风格,这将在第4节中进一步介绍。据我们所知,这是第一篇研究表达性语音转换的论文。G(x,Ey,cy)中附加的Ey鼓励G(x,Ey,cy)携带依赖说话者的情绪风格信息,使C更容易对G(x,Ey,cy)在目标域具有较高的准确率。我们得到了如图4(a).所示的64维情绪风格特征然后,我们使用一个全连接的层,将情感风格的特征与36维的mcep合并在一起,然后将其用作生成器的输入。
2023-08-07 23:19:03
165
翻译 音色转换论文粗翻||TOWARD DEGRADATION-ROBUST VOICE CONVERSION走向降级-稳健的语音转换
ABSTRACT任意到任意的语音转换技术可以将一个话语的音色转换为任何说话者,即使在训练过程中也看不见。虽然已经有了几个最先进的任意到任意的语音转换模型,但它们都是基于干净的话语来转换成功的。然而,在现实世界中,很难收集到说话者的干净话语,而且它们通常会因噪音或混响而退化。因此,我们非常希望理解这些退化如何影响语音转换,并建立一个退化健壮的模型。我们在本文中报告了第一个对任意语音转换的退化鲁棒性的全面研究。我们表明,目前最先进的模型的性能受到了严重的阻碍。
2023-08-07 22:43:17
166
翻译 音色转换论文粗翻译||A COMPARISON OF DISCRETE AND SOFT SPEECH UNITSFOR IMPROVED VOICE CONVERSION
我们还将我们的语音转换系统与两种常见的基线进行了比较: AutoVC5 [8]和来自语音转换挑战2020 [9]的级联ASR-TTS6系统[6]。总之,离散的内容编码器将一个输入的话语映射到一系列离散的语音单元h d1,……式中,i为第i个离散单元的聚类指数,ei为相应的可训练嵌入向量,sim(·,·)计算软单元和离散单元之间的余弦相似度,τ为温度参数…然后,一个线性层投射输出,以产生一系列的软语音单元h s1,。通过对离散单元分配中的不确定性进行建模,我们的目标是保留更多的内容信息,从而纠正错误的发音。
2023-08-07 21:48:56
198
翻译 SIG-VC: A SPEAKER INFORMATION GUIDED ZERO-SHOT VOICE CONVERSIONSYSTEM FOR BOTH HUMAN BEINGS AND MAC
我们对说话者的嵌入进行了客观的评估,作为一个额外的指标,以评估两个话语是否属于同一话语话者我们计算了我们提出的系统和预测的说话者嵌入之间的余弦相似度。由于两个说话者信息操纵者的参数是共享的,所以PreNet1基本上表示说话人信息的删除,而PreNet2表示说话人信息的添加。我们还计算三对发言人嵌入的余弦相似度在图5中,预测嵌入之间的相似性分数嵌入和平均目标嵌入,嵌入之间的嵌入相同的话语和平均嵌入的发言人,和不同的话语的嵌入和另一个不同的说话者的平均嵌入。设ˆX表示SI加法器的输出,X表示给定的mel谱图。
2023-08-07 21:20:24
117
翻译 AC-VC: NON-PARALLEL LOW LATENCY PHONETIC POSTERIORGRAMS BASEDVOICE CONVERSION AC-VC:基于非并行低延时语音后处理的语音
AC-VC:基于非并行低延时语音后处理的语音转换。
2023-08-07 17:19:03
81
翻译 粗翻译||End-to-End Voice Conversion with Information Perturbation
语音转换的理想目标是将源说话者的语音转换为类似于目标说话者的自然声音,同时保持语言内容和源语音的韵律。然而,目前的方法不足以在转换后的语音中实现全面的源韵律传输和目标说话人音色保存,由于声学模型与声码器的不匹配,转换后的语音的质量也不令人满意。在本文中,我们利用信息扰动的最新进展,提出了一种完全的端到端的方法来进行高质量的语音转换。我们首先采用信息扰动来去除源语音中与说话人相关的信息,以解开说话人的音色和语言内容,然后通过内容编码器对语言信息进行建模。
2023-08-07 16:19:01
83
翻译 在非并行语音转换中传输源样式Transferring Source Style in Non-Parallel Voice Conversion
本研究提出了一种基于序列到序列的非并行VC方法,该方法能够通过显式建模将语音风格从源语音转换到转换语音。客观评价和主观听力测试表明,所提出的VC方法在语音自然性和说话人相似性方面具有优越性。实验结果还表明了该方法的源式可转移性
2023-08-07 15:06:05
77
翻译 Towards Low-Resource StarGAN Voice Conversion using Weight Adaptive Instance Norm向低资源的权重自适应语音转换实例规范化
Many-to-many voice conversion with non-parallel training data hasseen significant progress in recent years. It is challenging becauseof lacking of ground truth parallel data. StarGAN-based modelshave gained attentions because of their efficiency and eff
2023-08-02 16:15:57
99
原创 P8第一讲(选修):反向传播Backpropagation
backpropagation(反向传播)可以帮助我们有效的进行渐变迭代计算(帮助计算梯度)。
2023-01-05 19:47:26
291
原创 p2机器学习基本概念简介
ML的总体来说就是Looking for Function,每个Function可以实现特定的任务,而特定的任务大致可以分为三类:回归 ,输出是一个数值;分类 ,给定选项(classes),Function给出correct one;结构学习 ,生成或者创造特定结构的内容;
2023-01-04 17:43:39
481
翻译 用于说话人验证的多查询多头注意力池和 Inter-TOPK 惩罚
在一些混淆的说话者上增加额外的类间topK惩罚。通过采用MQMHA和inter-topK惩罚
2022-11-14 22:57:01
330
原创 【无标题】无聊的代码
vars='uid=236&type=ab&kw=hh'res=vars.split('&')# print(res)for i in res: r=i.split('=') print(r) # print(r.pop())# print(res)#魔方阵n =5# 5*5二维列表magic_square = [[0 for x in range(n)] for y in range(n)]i = n /.
2021-12-18 10:27:34
513
原创 创建第一个Django第一项目
修改:Performing system checks...System check identified no issues (0 silenced).You have 18 unapplied migration(s). Your project may not work properly until you apply the migrations for app(s): admin, auth, contenttypes, sessions.Run 'python ...
2021-08-08 23:58:15
236
原创 Pycharm中 安装 Django
创建应用使用命令行模式创建应用在 Terminal 中输入python manage.py startappapp01(应用名):【Django在Terminal中python manage.py startapp 应用名报name 'os' is not defined解决办法:打开settings文件,加上import os】此时新建了一个app01文件app01应用文件中包含:admin.py :管理站点模型的声明文件,默认为空。apps...
2021-08-08 22:56:02
1196
原创 生成器和迭代器python
=生成器如何读取大文件:def readmylines(f,mewline): buf = "" while True: while newline in buf: pos = buf.index(newline)#找到字符的位置 yield buf[:pos] ...
2021-08-08 17:38:35
87
原创 第八章 元类编程复习
proterty动态属性property 作用和应用场景:@property 优化了属性读取和设置的可读性 需要限制属性的特征; 只读属性。如果属性只可以读,不可以写,用起来很方便。 这个属性根据一个变化的环境动态改变。 举例https://www.cnblogs.com/wagyuze/p/10622561.htmlfrom datetime import datetime, dateclass User: def __ini...
2021-08-08 16:38:52
89
原创 Python属性描述符对象
实例中的属性,类中的属性动态的创建类通过函数type创建类:bases基类 dict属性无type时候元类创建方法描述符是什么:描述符本质就是一个新式类,在这个新式类中,至少实现了__get__(),__set__(),__delete__()中的一个,这也被称为描述符协议__get__():调用一个属性时,触发__set__():为一个属性赋值时,...
2021-08-08 15:44:30
170
原创 魔法函数__getattr__(有条件执行)和 __getattribute__(无条件执行)区别
#__getarr__,__getattribute__#__getattr__就是在查找不到属性的时候调用from datetime import dateclass User: def ___init__(self,name,brithday,info={}): self.name=name self.brithday=brithday self.info=info def __getattr__(self, item): ...
2021-08-08 13:58:14
167
原创 追求美好!我用python~~~~
#不建议继承List和dictclass Mydict(dict): def __setitem__(self, key, value): super().__setitem__(key,value*2)my_dict=Mydict(one=1)print(my_dict)my_dict['two']=1print(my_dict)'''结果:{'one': 1}{'one': 1, 'two': 2}'''from collections import Us.
2021-08-07 15:36:56
79
编程C++基础资源学习
2022-11-14
WAV2LETTER++: THE FASTEST OPEN-SOURCE SPEECH RECOGNITION SYSTEM
2018-12-24
Double Joint Bayesian Modeling论文翻译
2018-11-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人