- 博客(57)
- 收藏
- 关注
原创 强化学习鱼书(10)——更多深度强化学习的算法
是否使用环境模型(状态迁移函数P(s’|s,a)和奖励函数r(s,a,V))。不使用环境模型的方法叫作无模型(model-free)的方法,使用环境模型的方法叫作有模型(model-based)的方法。模型的方法可以分为两种,一种是提供了环境模型的方法,另一种是训练环境模型的方法。
2025-06-03 14:49:04
557
原创 强化学习鱼书(9)——策略梯度法
除了基于价值的方法,还可以考虑不借助价值函数直接表示策略的方法。这就是基于策略的方法(policy-based method),其中通过神经网络等方法将策略模型化,并使用梯度来优化策略的方法叫作策略梯度法(policy gradient method) ——介绍见4DP的章节策略1->价值函数1收敛->改进策略2->价值函数2收敛->…
2025-06-03 10:40:34
875
原创 【isaaclab】报错Failed to create change watch : errno=28/No space left on device
这是Linux上的文件更改监视器限制,通常设置为8k。要么关闭其他使用监视器的应用程序,要么增加max_user_watches到512k。请注意,这将增加您的系统 RAM 使用。
2025-05-30 13:56:58
415
1
转载 【转】Issacgym安装
注意:按照文章,执行create_conda_env_rlgpu.sh会创建一个名为rlgpu的虚拟环境,虚拟环境的python版本是3.7的,运行基于3.8的代码可能不兼容。np.float从1.24起被删除。所用的代码是依赖于旧版本的Numpy。您可以将你的Numpy版本降级到1.23.5.isaacgym的官方安装教程。
2025-05-27 11:30:19
488
原创 强化学习鱼书(7)——神经网络和Q学习
0.建立虚拟环境1.安装cuda50系的显卡只支持torch的nightly+cuda12.8版本,别的版本会显示no kernel问题2.安装Dezero直接从github上拉<深度学习从零开始3项目>的代码,批量安装依赖。
2025-05-21 16:27:37
1201
转载 Unity PC端和移动端判断点击是否处于UI上
转自:Unity PC端和移动端判断点击是否处于UI上//PC端判断方法 public void IsOverUi_Standalone() { // EventSystem.current.IsPointerOverGameObject() // 该方法只要鼠标悬浮在UI(带有Image组件即可)上就会有相应 if (EventSystem.current.IsPointerOverGameObject())
2020-08-25 23:46:07
734
原创 三分之十的菜鸟unity学习小记(八)树效果
——喜欢才能创造价值树效果创建树树的属性创建树右键 -> 3DObject -> Tree把materia贴上去后如图所示:下图中按钮可以用来控制树枝的细节形状。 选中后如右图所示,其中方块均可以拖动来改变树枝的不同形状。树的属性树的属性参考...
2020-07-10 00:23:37
298
原创 三分之十的菜鸟unity学习小记(七)粒子系统
粒子系统布料系统布料系统物理引擎部分包括刚体和柔体两部分。柔体主要是通过粒子系统来实现,最主要的柔体就是布料系统。布料物体的创建(1)先创建empty GameObject然后 AddComponent -> Cloth(2)在SkinnedMeshRender组件中Mesh里选择需要作为布料的物体(第一次测试最好用默认平面,有些物体会出bug)然后还要选材质,否则看起来就是洋红色的(3)tranform里是布料的位置大小信息,而增加了两个组件 unity布料系统介绍...
2020-07-09 17:11:15
413
原创 三分之十的菜鸟unity学习小记(五)输入与控制
输入与控制输入管理器:虚拟轴输入管理器:虚拟轴虚拟轴的定义编辑(edit)->Project Settings ->输入虚拟轴如下:Gravity为按键由按下到复位时数值的回复速度;Snap选中为当两个按键同时按下时,视为复位状态更改Size可以调整虚拟轴的个数,可增加自定义的虚拟轴(比如说Z拿东西啊等等);注意:虚拟轴可以同名,同名的虚拟轴相当于并集触发,比如说按下空格和shift都可视为跳跃。获取虚拟轴数值:其中获取的value值范围为0,1,-1,未按下时为0,
2020-07-07 09:04:47
238
原创 三分之十的菜鸟unity学习小记(四)GUI用户界面
GUI图形界面GUI介绍GUI中不同控件GUI复杂控件GUI介绍用户图形界面,用来交互。unity把GUI事件创建和触发整合在了一起。用OnGUI函数即可完成。(OnGUI每帧执行,有点像Update)举个栗子using System.Collections;using System.Collections.Generic;using UnityEngine;public class Button : MonoBehaviour{ void Start() {
2020-07-06 17:57:33
354
原创 三分之十的菜鸟C#学习小记(十三)委托和事件
委托(Delegate)C# 中的委托(Delegate)类似于 C 或 C++ 中函数的指针。委托(Delegate)特别用于实现事件和回调方法。所有的委托(Delegate)都派生自 System.Delegate 类委托的定义:public delegate int NumberChanger(int n);委托的实例化:NumberChanger nc1 = new NumberChanger(AddNum); //后面的AddNum是方法名NumberChanger nc2 =
2020-06-25 13:21:11
183
原创 三分之十的菜鸟C#学习小记(十二)索引器
索引器(Indexer)索引器(Indexer) 允许一个对象可以像数组一样被索引。当您为类定义一个索引器时,该类的行为就会像一个 虚拟数组(virtual array) 一样。您可以使用数组访问运算符([ ])来访问该类的实例。索引器的行为的声明在某种程度上类似于属性(property)。就像属性(property),您可使用 get 和 set 访问器来定义索引器。但是,属性返回或设置一个特定的数据成员,而索引器返回或设置对象实例的一个特定值。换句话说,它把实例数据分为更小的部分,并索引每个部分,
2020-06-17 15:28:12
153
原创 三分之十的菜鸟C#学习小记(十一)异常处理和文件操作
异常处理C# 异常处理时建立在四个关键词之上的:try、catch、finally 和 throw。try:一个 try 块标识了一个将被激活的异常的代码块。后跟一个或多个 catch 块。catch:异常的捕获。finally:finally 块用于执行给定的语句,不管异常是否被抛出都会执行。例如,如果您打开一个文件,不管是否出现异常文件都要被关闭。throw:抛出一个异常语法:try{ // 引起异常的语句}catch( ExceptionName e1 ){ //
2020-06-15 00:56:40
406
原创 三分之十的菜鸟C#学习小记(十)接口和命名空间
接口(Interface)C#接口接口只包含了成员的声明。成员的定义是派生类的责任。接口提供了派生类应遵循的标准结构。抽象类在某种程度上与接口类似,但是,它们大多只是用在,当只有少数方法由基类声明,由派生类实现时。接口语法:using System;// 接口定义interface IMyInterface{ void MethodToImplement();}// 接口实现:和继承类似class InterfaceImplementer : IMyInterface{
2020-06-15 00:20:55
399
原创 三分之十的菜鸟C#学习小记(九)继承和多态
类的继承class Rectangle : Shape{}类内每个函数要说明是public还是啥(静态构造方法不用) class Shape { public void setWidth(int w) { width = w; } public void setHeight(int h) { height = h; } protected int width;
2020-06-14 22:29:27
194
原创 三分之十的菜鸟C#学习小记(八)string、struct和enum
字符串String调用时注意是 str.方法 还是String.方法(str)if (String.Compare(str1, str2) == 0)str.Contains("test")string substr = str.Substring(23); string str = String.Join("\n", starray);string.Format()可以对日期进行格式化结构体Struct在 C# 中的结构与传统的 C 或 C++ 中的结构不同。C# 中的结构有以
2020-06-12 17:42:05
366
原创 三分之十的菜鸟C#学习小记(七) 数组和params
C#数组int[] array; int[] tmpArrayA = { 1, 2, 3, 4 }; //在栈区分配空间 int[] tmpArrayB = new int[3]; //在堆区 分配了 3个连续的int 4字节空间 int[] tmpArrayC = new int[3] { 1, 2, 3 }; //在堆区分配空间,并初始化 int[] tmpArrayD = new int[] { 1, 2, 3 }; //
2020-06-12 15:30:08
291
原创 三分之十的菜鸟C#学习小记(六) 引用ref和out
引用:ref和out引用都是传递引用,相当于C++的&ref和out的区别在于:用ref传入方法的参数时,必须对该参数赋初值;在方法进行调用时,也要加关键词ref,out被out修饰的变量使用前可以不初始化,因为即使初始化方法中也无法取得该值,但在方法中必须初始化(即使不使用)out 比起 ref 来说,还有一个用法就是可以作为多返回值来用,都知道函数只能有一个返回值,C#里,如果你想让一个函数有多个返回值,那么OUT能很容易解决。例 static void Meth
2020-06-11 17:09:58
200
原创 三分之十的菜鸟C#学习小记(三) Object类
Object类1.简介Object类是 .NET Framework 中所有类的最终基类;Object 是 System.Object 类的别名。所以对象(Object)类型可以被分配任何其他类型(值类型、引用类型、预定义类型或用户自定义类型)的值。但是,在分配值之前,需要先进行类型转换。小object是大Object的一个别名(C#),就如小int是Int32的别名一样。当一个值类型转换为对象类型时,则被称为 装箱;另一方面,当一个对象类型转换为值类型时,则被称为 拆箱。object obj;
2020-06-11 11:39:29
425
原创 三分之十的菜鸟C#学习小记(一) C#基础知识
C#基础C#开发环境Mac OS X搭建.Net环境 进行C#开发在 Mac 下想要用 C# 语言的话,首先得有个跨平台的 .Net 环境- Mono:Mono 官方下载地址: Mono有了 Mono 平台之后,还得有一个好工具:Xmarin Studio下载地址:Xmarin StudioC# 程序结构C#程序组成:命名空间声明(Namespace declaration)一个 classClass 方法Class 属性一个 Main 方法语句(Statements)&
2020-06-05 11:59:19
234
原创 Matlab里DTW算法和图像
今天学妹过来问我DTW算法相关的事,然后我就去看了下DTW算法本质上是两段数据,要对数据进行拉伸,让两段数据相似程度最高。作者的代码跑出来:拉伸后长度变成45,应该就是路径的长度,路径如下:白色的就是路径。作者的代码中画像素图部分的代码:Matlabfigure('Name','DTW - Accumulated distance matrix and optimal pat...
2020-06-05 10:40:52
2274
1
原创 win10+VS2017+DX11踩的那些雷
折腾了两天DX11的配置,我觉得还是win7+VS2010和win10+VS2017的组合比较好,win7下VS2017装DX11总有奇奇怪怪的问题简要记录下win10+VS2017+DX11的配置过程:我用的MAC的parallel虚拟机装的win10win10下载链接:https://blog.youkuaiyun.com/weixin_38168838/article/details/10230...
2020-06-05 10:40:08
541
原创 D3D犯的沙雕错误们
在创建库文件的时候疑惑为啥只出来了Debug文件夹没有Release文件夹:原来在创建库文件的时候有选项是Debug和Release的二者的差别如下:解决方案和工程的问题:生成解决方案的时候本地调试器输出窗口只有一个启动项目,默认为第一个。因此要查看某个项目的运行结果应该在工程处右键:设为启动项目...
2020-06-05 10:39:37
2011
原创 DXTK的处理
DXTK的安装过程:参考博客:Jun-DXTK安装安装地址:DXTK安装地址首先下载DXTK,然后显示界面:选择DirectXTK_Desktop_2017_Win10.sln打开;按教程所示跑出来之后发现多了个Bin文件夹和Lib文件夹:Lib中是生成的.lib库文件,Bin是中间文件注意:要设置成Release再生成一个(生成Release的时候显示):不知道为啥...
2020-06-05 10:38:37
966
原创 word排版
2019.5.18号这两天进行了一些多源融合那本书合稿和排版的工作学到的一些小tips选中某一章按F9可以刷新,刷新编号公式之类的[1]链接到参考文献,选中**[1]**插入链接里的交叉引用即可如果要在正文的图2.5跳转到图,只需在图的地方插入->链接->书签,再在图2.5上添加插入->超链接->跳转到书签针对mathtype中公式进行字号的更改...
2020-06-05 10:37:31
161
原创 三分之十的菜鸟C#学习小记(四) C#之属性
属性:get和set访问器1.属性的定义通常属性名的命名使用的是 Pascal 命名法,单词的首字母大写,如果是由多个单词构成,每个单词的首字母大写。属性定义如下:public 数据类型 属性名{ get { 获取属性的语句块; return 值; } set { 设置属性得到语句块; }}举个例子:class Student { private string cod
2020-06-05 10:22:15
194
原创 三分之十的菜鸟unity学习小记(三) 地形设置
unity地形之基础设置:地形的尺寸、分辨率等unity地形之起伏设置:在图示地方设置地形起伏,用画刷raise or lower在设置起伏时,原始平面高度为0,没法凹进去;要是想要抬高基础高度,选择下图的set Height,用处是像刀片一样,把起伏弄成设置的高度。选择flatten all,就是设置整个平面的高度。设置后画面刷新。...
2020-05-28 12:48:25
2222
1
原创 三分之十的菜鸟C#学习小记(五)Static
static静态类static静态类,在某个类中只有一个,不会因实例化对象的不同而不同。static可以修饰类、字段、属性、方法等。如一个方法前加上static修饰后,如果要对其进行调用可以直接通过类名点出来,不用再对类进行实例化。如:一个公司(类),下面有很多个员工(new 的实例) ,每个员工都有自己的电脑(成员变量),公司有食堂(static 成员)。使用时必须指出 所有者 例如 “职...
2020-05-28 12:48:15
265
原创 三分之十的菜鸟unity学习小记(二)unity中C#脚本
persp视图在场景右上角可以切换persp视图(透视图)和iso视图(正交视图)。在persp视图里,可以通过上下左右键控制我的镜头。摁住鼠标右键WASD同样效果,鼠标右键+QE是上下。shift+右上角方块中心:45度下俯视图(较好)shift+ctrl:表面吸附按V键,随后移动鼠标:顶点吸附;按shift+V:关闭顶点吸附灯光灯光可以添加组件(这样是实时灯光);还可以用...
2020-05-28 12:47:49
560
原创 三分之十的菜鸟C#学习小记(二) C#数据类型和转换
C#数据类型C#内数据类型参考整数: 1. 有符号数:sbyte,short,int , long;(1Byte,2Byte,4Byte,4/8Byte)2. 无符号数:byte, ushort,uint, ulong;浮点数:单精度 float,双精度double,长精度decimal(4,8,12Byte)//末尾f的意义是 转换为float, 系统默认为double, 所以在数值末...
2020-05-03 11:44:42
733
原创 python remove使用错误
python中的列表在使用remove删除元素后!索引掉到下一位!如果在循环中意思是会跳两位比如:运行结果:可以看出,在第一个cat删掉之后,此时cats==cat,因此print(cats)输出是cat,但cat已经删掉实际上索引指向了dog,然后再进到for行之后,索引++,于是cats又指向了cat;因此cats一直输出cat为啥最后一个cat没删掉?索引每次+2跳过去了如...
2019-12-19 16:45:54
1313
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅