- 博客(2)
- 收藏
- 关注
原创 ALbert和Bert简单解读
Albert和Bert代码简单介绍这篇文章将借助Albert的代码将Albert和Bert简单介绍一下。一 区别(Albert变化)词嵌入向量参数的因式分解 O(V * H) to O(V * E + E * H) V:字典个数。 E:输入层。 H:隐藏层。 如以ALBert_xxlarge为例,V=30000, H=4096, E=128 那么原先参数为V * H= 30000...
2020-03-02 11:02:42
3250
原创 从感知机到支持向量机
从感知机到SVM最近通过李航老师的统计学习复习机器学习相关内容,记录一下.感知机为什么会有感知机语言模型解决了一个句子的在输入空间的概率分布,如果我们想把句子分类,应该这么做呢,我们首先从最简单的开始,假设句子都是线性可分了,就像下面的例子所示,那么感知机就是用来将其分类的.感知机怎么做的上图所示是是在一个二维空间,从图中可以看到,输入是(x1, x2) ,输出就是’判断这个点是在这...
2020-03-02 10:44:21
277
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅