- 博客(14)
- 资源 (1)
- 收藏
- 关注
原创 深度强化学习——A3C
异步的优势行动者评论家算法(Asynchronous Advantage Actor-Critic,A3C)是Mnih等人根据异步强化学习(Asynchronous Reinforcement Learning, ARL) 的思想,提出的一 种轻量级的 DRL 框架,该框架可以使用异步的梯度下降法来优化网络控制器的参数,并可以结合多种RL算法。
2017-06-13 20:32:33
53542
原创 深度强化学习——Dueling-DDQN
深度双Q网络(DDQN)和基于竞争构架Q网络(Dueling-DQN)都是DQN的改进版本,前者是对DQN训练算法的改进,后者是对DQN模型结构的改进。
2017-06-13 09:38:56
33950
原创 机器人手眼协调——机械臂自主抓取物体
KinectV2作为视觉输入,获取目标物体以及机械臂各关节在三维空间中的位置,结合几何运动学和数据训练方法实现机械臂自主抓取目标物体。
2017-06-10 19:45:01
51671
7
原创 深度强化学习控制移动机器人
使用深度强化学习控制移动机器人在复杂环境中避障、收集物品到指定点。所用到的算法包括DQN、Deuling-DDQN、A3C、DDPG、NAF。
2017-06-10 17:47:31
14570
1
原创 IMU姿态融合(MPU9250从校正到滤波步骤)
MPU9250包括三轴加速度计、三轴陀螺仪和三轴磁力计。因为加速度/磁力计具有高频噪声(需要低通滤波),将加速度/磁力计的信号看成是音频信号,它们的信号会有很多“毛刺“,也就是说它们的瞬时值不够精确,解算出来的姿态会震荡,但长期来看姿态方向是对的。而陀螺仪具有低频噪声(需要高通滤波),即每个时刻的得到的角速度是比较精确的,使用积分就能得到旋转角度
2017-06-08 21:06:39
77809
13
原创 深度强化学习——DQN
DQN(Deep Q-Learning)可谓是深度强化学习(Deep Reinforcement Learning)的开山之作,是将深度学习与增强学习结合起来从而实现从感知(Perception)到动作( Action )的端对端(End-to-end)学习的一种全新的算法。
2017-06-05 21:55:24
114765
21
翻译 四元数与旋转——学习笔记(三)
四元数与旋转——学习笔记(一) 四元数与旋转——学习笔记(二) 四元数与旋转——学习笔记(三)五、四元数的微分和积分假设前面公式(1)给出的四元数是时间 tt 的函数。则对 q(t)q(t) 求导有: q=q0˙+q˙=q0˙+q1˙i^+q2˙j^+q3˙k^q=\dot{q_0}+\dot{\boldsymbol{q}}=\dot{q_0}+\dot{q_1}\hat{i}+\dot{q_
2017-06-01 15:05:53
17728
2
翻译 四元数与旋转——学习笔记(二)
四元数与旋转——学习笔记(一) 四元数与旋转——学习笔记(二) 四元数与旋转——学习笔记(三)三、四元数旋转算子四元数原本是表示四维空间R4\Re^4的,而在对三维空间R3\Re^3的向量v=(xv,yv,zv)\boldsymbol{v}=(x_v,y_v,z_v)进行运算时使用的是纯四元数,该四元数的实数部分为0。因此向量v\boldsymbol{v}的四元数表示为xvi^+yvj^+zvk
2017-06-01 11:28:08
4960
翻译 四元数与旋转——学习笔记(一)
一、引言三维空间里向量或坐标系之间的旋转关系可以用3×33\times3的标准正交矩阵表示,称为旋转矩阵。但是,旋转矩阵中的9个元素只有4个是独立的,因此它是冗余的,而且它的几何解释也不够清楚。此外,在进行两次旋转时,两个旋转矩阵相乘需要进行27次乘法和18次加法操作。四元数(quaternion),是在1843年W.R.Hamilton与他妻子在都柏林皇家运河边散步时突然想到的,他把四元数乘法的基
2017-06-01 11:02:15
9074
原创 基于人机交互的智能巡逻车实时控制方式的研究及实现
人机交互技术是通过识别人体包括手势、体势、表情等动作,甚至采用语音和生物电信号实现人与计算机的多通道融合的交互技术。Kinect作为一个划时代的产品,通过获取彩色图像、深度图像以及人体骨骼图像提供一项全新的人机交互的方式,使人机互动的理念更加彻底的展现出来。它能够捕捉、跟踪以及解密人体的动作、手势以及声音。另一方面,随着智能机器人的发展,移动式机器人逐渐成为一个主要的研究热点。本文通过利用Kine
2017-05-25 19:40:39
2482
原创 和声搜索算法——个人解读
和声搜索算法(Harmony search, HS)是一种新兴的智能优化算法,通过反复调整记忆库中的解变量,使函数值随着迭代次数的增加不断收敛,从而来完成优化。算法概念简单、可调参数少、容易实现。类似于模拟退火算法对物理退火的模拟、遗传算法对生物进化的模仿、以及粒子群优化算法对鸟群的模仿等,和声算法模拟了音乐演奏的原理,它是 2001 年韩国学者 Geem Z W 等人提出的一种新颖的智能优化算法。
2017-05-25 09:46:42
27453
7
原创 小脑神经网络——CMAC
小脑神经网络 小脑神经网络(CMAC-Cerebellar Model Articulation Controller)是由Albus最初与1975年基于神经生理学提出的,它是一种基于局部逼近、简单快速的神经网络,能够学习任意多维非线性拟合。相比于BP网络等全局逼近方法,CMAC具有以下优点
2017-05-24 17:00:51
18784
9
平衡二叉树操作的演示
2013-12-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人