60、无监督网络模型:原理、应用与发展

无监督网络模型:原理、应用与发展

在无监督学习领域,存在多种网络模型,它们在不同的应用场景中发挥着重要作用。本文将详细介绍无监督复合网络以及无监督个体发生网络中的相关模型,包括其原理、应用和改进。

1. 无监督复合网络

无监督复合网络在早期存在一些问题,例如在某些应用中,ACE(Adaptive Critic Element)元素的使用存在局限。这一问题导致在相关研究中,Anderson(1989,1987)用两层前馈网络取代了ACE元素。

1.1 典型应用

杆平衡问题(Barto等,1983)是与ACE相关的经典应用。在这个问题中,系统需要通过学习来控制杆的平衡,ACE在其中起到了重要的作用。

1.2 硬件实现

目前作者尚未了解到相关的硬件实现案例。

1.3 变体与改进
  • 集成CMAC :Lin和Kim(1991)描述了Barto原始ACE - ASE控制结构的扩展,他们将小脑模型关节控制器(CMAC)集成到其中。
  • 两层网络替代 :Anderson的自适应评价网络通过两层网络实现了ACE的功能。在这项工作中,对工厂状态空间进行划分并为ACE提供输入的解码器被一层可训练的神经元所取代。本质上,解码器 - ACE结构被两层前馈反向传播类型的网络所替代,该网络学习执行解码器 - ACE的复合功能。作为通用函数逼近器,两层网络可以使用反向传播类型的算法(Anderson,1987)学习系统从原始状态变量(解码器的前输入)到前ACE输出所需执行的功能。这也使得学习更复
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值