- 博客(5)
- 收藏
- 关注
原创 Task04
导入数据-数据预处理-分词-建立词典-载入数据集。Encoder-Decoder:Sequence to Sequence模型:训练:预测:具体结构:Beam Search简单greedy search:维特比算法:注意力机制框架:引入注意力机制的Seq2seq模型:...
2020-02-19 21:56:02
159
原创 Task05
卷积层填充:如果原输入的高和宽是nh和nw,卷积核的高和宽是kh和kw,在高的两侧一共填充ph行,在宽的两侧一共填充pw列,则输出形状为:(nh+ph−kh+1)×(nw+pw−kw+1)2.步幅:一般来说,当高上步幅为sh,宽上步幅为sw时,输出形状为:⌊(nh+ph−kh+sh)/sh⌋×⌊(nw+pw−kw+sw)/sw⌋如果ph=kh−1,pw=kw−1,那么输出形状将...
2020-02-19 21:45:31
162
原创 Task03
过拟合、欠拟合[1] 机器学习模型应关注降低泛化误差。[2] 欠拟合:模型无法得到较低的训练误差[3] 过拟合:模型的训练误差远小于它在测试数据集上的误差[4] 影响因素:模型复杂度和训练数据集大小其中,模型复杂度和误差之间的关系:[5] 解决方法:权重衰减:L2 范数正则化,在模型原损失函数基础上添加L2范数惩罚项,从而得到训练所需要最小化的函数。...
2020-02-19 21:28:42
128
翻译 文本处理、语言模型、循环神经网络
文本处理文本预处理步骤:(1)读入文本(2)分词,将每一个句子划分成若干个词(token),转换为一个词的序列(3)建立字典,将每个词映射到一个唯一的索引(index)(4)将词转为索引,方便输入模型语言模型(1)词的概率可以通过该词在训练数据集中的相对词频来计算(2)n元语法:作用:简化模型,减少计算量和存储量;缺陷:参数空间过大;数据稀疏循环神经网络...
2020-02-14 20:45:13
270
原创 机器学习-线性回归
1、基本形式:向量表示形式:2、线性回归(1)一元线性回归:线性回归模型试图学习到:那么,如何学习?使均方误差最小化:即求的最小值将分别对求导,得到:令两式均为0,求得:(2)多元线性回归当样本由d个属性构成时,试图学得:,即构成多元线性回归。将b并入w,数据集D改成m*(d+1)的矩阵:求:当为满秩矩阵时求得:最终线性回归模型为:问题:实际...
2020-02-14 19:37:31
186
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅