- 博客(19)
- 资源 (11)
- 收藏
- 关注
原创 万向节锁死
就是你会以一个固定的顺序来进行旋转,但是你旋转过程中可能把某个方向给转没了。比如下图,固定旋转顺序为x,y,z.先沿x旋转一定角度,再沿y轴朝着屏幕前的你旋转90度(此时x变成了原来z轴的负方向,原来的z轴没有了,变成到了x方向去。)好,现在应该旋转z轴方向了,但是此时旋转z轴就是和之前旋转x轴是一样的效果,不能通过旋转z轴达到旋转俯视图的效果了。所以相当于少了一个自由度(就全局坐标而言),这种就称为万向节死锁gimbal lock。参考文献可能没有讲清楚,强烈推荐去看看下面两篇文章,写得特别详细。
2021-11-17 15:54:37
867
原创 多智能体强化学习仿真环境Unreal Engine和Unity3D
AirSim入门遇到的问题自动编译山脉景观失败打开UE4时,弹出窗口,报error:三级目录参考教程https://www.zhihu.com/column/multiUAV自动编译山脉景观失败问题:创建C++类时,出现了 已成功添加类“MyClass”,但必须在重新编译“LandscapeMountains”模块后它才会出现在内容浏览器中。自动编译山脉景观模块失败解决办法:删掉中文版的“山脉景观”,把Epic Game 在设置里面把语音改为English,重新下载“LandscapeMountai
2021-10-30 21:46:51
7357
原创 放弃在QT小游戏里面嵌入Q-learning的python脚本,用C++实现了Q-learning与游戏交互
一直想给这个游戏加一个RL的大脑。我为了确定要用到哪些状态,和动作,以及奖励,回合的定义。我设想了一个最简单逻辑,此处存活的敌机群它们的x坐标的平均值avg_x,以及我方飞机的x坐标m_hero.m_X,让我方飞机向敌机群靠近打击,avg_x比m_hero.m_X小则向右移动,avg_x比m_hero.m_X大则向左移动。动作:action:一维,0表示不动,1表示向左移,2表示向右移。奖励:子弹碰到一架敌机则记1分回合结束:我方飞机的机身与敌方飞机的机身发生碰撞。状态的设置可以是很多情况:.
2021-10-12 21:24:07
1079
原创 Qt中嵌入Python代码爬坑
Python官网的文件中有将Python嵌入的,这是python3.8的嵌入#define PY_SSIZE_T_CLEAN#include <Python.h>intmain(int argc, char *argv[]){ wchar_t *program = Py_DecodeLocale(argv[0], NULL); if (program == NULL) { fprintf(stderr, "Fatal error: cannot dec
2021-09-26 11:03:21
1312
1
原创 将图片集变成动图——ImageMagick工具
从这里下载ImageMagick下载完成后,试试在cmd里面试试convert命令能不能用。ImageMagick convert教程管理员运行也救不了我,就是不行!不好意思,有点尴尬…我发现我路径没对,打扰了。现在正常了。好吧,现在程序是安好了,把准备好的图片集(A*算法寻找最短路径的每一步图)拿出来,制作动图使用命令:(把文件夹的所有png格式的图都拿出来制作一个gif动图)convert -delay 50 *.png animated.gif完成转变!wait…来看看成
2021-09-14 13:38:26
364
原创 用Qt做一个飞机大战的游戏
直接根据网上的资料,一步一步做的,相较于之前用Python做的,我方飞机只能左右移动,这里的飞机是鼠标控制,可以到达界面的任意位置。学习资源在我的资源可以下载,或者去百度网盘下载提取码:f7om...
2021-09-02 13:07:50
274
原创 RL基础算法优缺点总结
RL基础算法优缺点总结RL算法主要分为三类:基于值(value-based)系列,基于策略梯度(Policy-gradient)系列,以及两者相结合的Actor-Critic系列。今天主要介绍这三类中典型的算法的核心思想以及它们各自的优缺点。value-based 类别首先从基于值这类算法说起,这类算法的特点是计算状态价值V(s)或者是状态动作价值Q(s,a),通过提高价值来优化策略。其中典型的算法有Q-learning、Sarsa、DQN,DDQN。从Q-learning算法说起,它算是DQN这
2021-09-02 12:40:43
4704
2
原创 Importance Sample 减小prioritized experience replay带来的概率不均问题
Importance Sample的定义从李宏毅老师的PPO的讲解中我们可以知道,我们本来要计算p分布下f(x)的期望,但是现在我们不从p中采样,我们从q中采样x,来计算f(x)的期望。在上图中我们可以看到经过变形,f(x)乘上了一个p(x)/q(x),这个p(x)/q(x)相当于一个修正p,q分布差异的权重因子。当然p和q也不能相差太大,虽然两者均值一样,但是当p(x)/q(x)太大时,方差就不一样了,如果采样不够多的话,也会导致两者均值不一样。我们是因为off-policy,而引出的impor
2021-08-22 18:03:58
240
原创 强化学习算法学习
我们可以把强化学习算法分为三类:Policy-based、Value-based和将两者结合的算法(如Actor-Critic).Policy-based:输入状态,输出下一动作的概率。如Policy Gradient。Value-based:输入状态,输出动作的价值。如Q-learning、Sarsa。AC:输入状态,Actor网络输出动作,Critic根据动作输出对应的价值,将价值传递给Actor网络,来改变动作的概率。如A3C、A2C。我们也可以把强化学习算法分为两类:On-polic
2021-08-08 11:19:53
1074
原创 python实现相机成像原理
摄像的流程:拍摄物体发射过来的光,透过相机的光学器件,在经过颜色滤波阵列,进行白平衡,去马赛克,亮度调节,编码,最后压缩。1、将一张.CR2图片变成.tiff格式的图片yong
2021-06-16 22:05:54
708
原创 猫狗分类项目学习
深度学习框架:目前最流行的深度学习框架是:PaddlePaddle,Tensorflow,caffe,Theano,MXNet,Torch和Pytorch.文章目录前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于
2021-05-26 21:51:46
609
原创 手写数字识别
题目链接数字图像识别给一张图片,图片里面写了一个数字可能是0-9,然后需要设计算法判断出这个数字是0-9中哪一个数字。题目链接软件:pycharm框架:keras网络:LeNet输入,输出格式:.cvs文件用keras框架实现手写数字识别题目链接前言一、经典网络LeNet5?二、使用步骤1.引入库2.读入数据总结前言人工智能入门项目,初学者练手,了解神经网络的搭建,见识经典的网络结构一、经典网络LeNet5?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决
2021-05-10 09:28:34
401
原创 基于车牌形状和颜色的车牌定位
车牌识别学习前言:近年来,人工智能的研究不断深入,智慧城市,智慧交通也引起了大家的关注,车牌识别作为智慧交通的重要一环,被广泛应用在:停车场管理,违章处理,高速收费等领域。同时也随着新能源汽车的不断增多,原来识别普通汽车7字符车牌的车牌识别系统需要增加识别新能源汽车8字符车牌的功能。车牌识别主要分为四个步骤:车牌定位,车牌矫正,字符分割和字符识别。车牌定位:在一张含有车牌的图片中找到车牌区域。主要由三个方向的方法:一、基于特征的算法,如基于颜色特征和边缘特征的算法,基于字符边缘的算法,就是找到内部
2021-05-05 10:57:08
10165
7
原创 JPEG压缩技术
JPEG压缩JPEG压缩的步骤JPEG(Joint Photographic experts group)图像压缩技术,能在保证图像质量的同时最大程度地降低数据冗余。JPEG压缩的步骤1、颜色空间转换:RGB→\rightarrow→YUV/YCbCrYC_bC_rYCbCr...
2021-02-01 15:03:04
1193
原创 集成学习理解
集成学习概念:先构建一组分类器,再将分类器的预测结果以投票的方式进行决策。Boosting思想:从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个基学习器;关于AdaBoost算法:他是Boosting族算法中最著名的代表...
2021-01-14 16:58:24
173
原创 决策树理解
1.决策树概述决策树既能做分类也能做回归。例子:判断家庭成员是否爱打篮球根节点:年龄是否小于15非叶子节点:是否为男性叶子节点:最后的节点,下面没有分类了。2.熵原理解读引入:多个属性,选择哪个当根节点?熵:表示系统内部的混乱程度,...
2021-01-14 14:28:40
518
原创 spectral clustering谱聚类论文解读(上)
关于A Tutorial on Spectral Clustering的解读1、介绍2、相似图3、拉普拉斯图4、谱聚类算法本身5、切图6、随机游走的理解7、微扰理论方法8、谱聚类的实际问题9、谱聚类的拓展以及与谱聚类相关的文献1、介绍相比与传统的聚类算法如k-means,single linkage,spectral clustering有更好的基础性优势。single linkage:要提到AGNES:是一种自底向上的聚类方法,它把每个样本都看成一类,再把距离相近 的类别进行
2020-12-25 20:13:20
2076
2
alien_invasion
2020-10-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人