coqui(二)-基于character的文本到序列

Db1x 16121

text_to_sequence

对每个拼音的字母建模

_symbols, _ = make_symbols(**tp)

返回两个值,这里只要_symbols不要phone

注:参数前面加上* 号 ,意味着参数的个数不止一个

带一个星号(*)参数的函数传入的参数存储为一个元组(tuple)→(2,3,4)

带两个(*)号则是表示字典(dict)→{a:2, b:3}

sequence += _symbols_to_sequence(_clean_text(text, cleaner_names))

中间经过了clearn清洗了文本

_symbols_to_sequence 结果如下

然后每个token之间插入一个blank 148

经过text = np.asarray 将上面的变成数组

经__getitem__

没对应上的原因:数据边加载边训练 加载的进程和训练的进程一起运行,打印的东西会错乱

当batchsize为1时,先加载了7组数据

然后运行到代码的生成batch的部分,将上面的数据,按顺序迭代训练,batch的数据就是模型输入的x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值