自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Task04

导入数据-数据预处理-分词-建立词典-载入数据集。 Encoder-Decoder: Sequence to Sequence模型: 训练: 预测: 具体结构: Beam Search 简单greedy search: 维特比算法: 注意力机制框架: 引入注意力机制的Seq2seq模型: ...

2020-02-19 21:56:02 146

原创 Task05

卷积层 填充: 如果原输入的高和宽是nh和nw,卷积核的高和宽是kh和kw,在高的两侧一共填充ph行,在宽的两侧一共填充pw列,则输出形状为: (nh+ph−kh+1)×(nw+pw−kw+1) 2.步幅: 一般来说,当高上步幅为sh,宽上步幅为sw时,输出形状为: ⌊(nh+ph−kh+sh)/sh⌋×⌊(nw+pw−kw+sw)/sw⌋ 如果ph=kh−1,pw=kw−1,那么输出形状将...

2020-02-19 21:45:31 150

原创 Task03

过拟合、欠拟合 [1] 机器学习模型应关注降低泛化误差。 [2] 欠拟合:模型无法得到较低的训练误差 [3] 过拟合:模型的训练误差远小于它在测试数据集上的误差 [4] 影响因素:模型复杂度和训练数据集大小 其中,模型复杂度和误差之间的关系: [5] 解决方法: 权重衰减:L2 范数正则化,在模型原损失函数基础上添加L2范数惩罚项,从而得到训练所需要最小化的函数。 ...

2020-02-19 21:28:42 114

翻译 文本处理、语言模型、循环神经网络

文本处理 文本预处理步骤: (1)读入文本 (2)分词,将每一个句子划分成若干个词(token),转换为一个词的序列 (3)建立字典,将每个词映射到一个唯一的索引(index) (4)将词转为索引,方便输入模型 语言模型 (1)词的概率可以通过该词在训练数据集中的相对词频来计算 (2)n元语法: 作用:简化模型,减少计算量和存储量; 缺陷:参数空间过大;数据稀疏 循环神经网络 ...

2020-02-14 20:45:13 258

原创 机器学习-线性回归

1、基本形式: 向量表示形式: 2、线性回归 (1)一元线性回归: 线性回归模型试图学习到: 那么,如何学习?使均方误差最小化: 即求的最小值 将分别对求导,得到: 令两式均为0,求得: (2)多元线性回归 当样本由d个属性构成时,试图学得: ,即构成多元线性回归。 将b并入w,数据集D改成m*(d+1)的矩阵: 求: 当为满秩矩阵时求得: 最终线性回归模型为: 问题:实际...

2020-02-14 19:37:31 174

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除