概念
RNN模型——处理序列信息
最先应用于NLP,用于为语言模型建模
语言模型: 对一种语言的特征进行建模
N-Gram:假设一个词出现的频率只与前面的N个词相关。
模型大小和N的关系是指数级的,N=4就会占用巨大的存储空间。
→RNN
基本循环神经网络
输入层:x向量
隐藏层:s向量
输出层:o向量
U是输入层到隐藏层的权重矩阵
V是隐藏层到输出层的权重矩阵
W是隐藏层上一次的值作为这一次的输入的权重矩阵
展开看图:
这个网络在t时刻接收到输入Xt之后,隐藏层的值是St,输出值是Ot。
St的值不仅仅取决于Xt,还取决于St-1。
Ot = g(VSt)
St = f(UXt+WSt-1)


循环神经网络(RNN)是一种适用于处理序列信息的模型,最初应用于自然语言处理(NLP)。它能记住之前的输入状态,从而考虑上下文信息。N-Gram模型由于存储需求大而被RNN替代。RNN的基本结构包括输入、隐藏和输出层,通过权重矩阵传递信息。双向RNN同时考虑正向和反向依赖,而深度RNN则通过堆叠多个隐藏层增强表达能力。
最低0.47元/天 解锁文章
1085

被折叠的 条评论
为什么被折叠?



