- 博客(31)
- 收藏
- 关注

原创 Deep Reinforcement Learning DRL深度强化学习入门知识笔记
我记录了自己在学习强化学习的过程中的学习进展、相关知识点的笔记以及个人的理解。这些内容可能不完全是专业的解释,但我相信它们对大家掌握深度强化学习会有所帮助。另外,我手写了一些证明过程,虽然字迹不太美观,还请大家多多包涵。学习视频详情见王树森老师:也可参照赵世钰老师:【一张图讲完强化学习原理】 30分钟了解强化学习名词脉络 (youtube.com)这两位老师的讲解都非常出色。记得使用目录来查阅内容。这些资料非常详细、全面,不仅适合预习,还可以作为今后的参考。
2024-08-02 23:40:51
1967
原创 【创新项目实训个人博客】camel学习笔记(2)
1、: 使用连续发送多条用户消息,模拟多轮对话。比如,先询问 CAMEL 的用途,然后再根据回复提出后续问题,看看ChatAgent是否能保持上下文连贯根据结果可以看出,Agent是能够理解之前的对话,并根据之前的聊天内容给出建议。2、: 尝试传入不同图片或使用等参数,观察ChatAgent的回答变化。可以试试让ChatAgent对比两张不同的图片,并描述区别通过实验,设置不同的角色,Agent给出的回答是不一样的,例如:这两种角色定位,给出的答案是不一样的。
2025-04-04 17:45:00
62
原创 【创新项目实训个人博客】deepseek api接入
经历:由于创新实训提供的api太过卡顿,并且技术支持不回消息我们选择使用官方deepseekapi,高并发,无卡顿,比学校提供的好用多了(但是收费。。。
2025-03-30 23:46:24
832
2
原创 powershell7.5.0不支持conda的问题
经历:这周手欠使用vscode的powershell时提示我更新,我就更新了,更新完激活不了conda环境了,查询了半天是powershell最新版7.5.0与目前conda25.1.1以前的版本不支持的问题。问题环境:powershell版本>=7.5.0,conda版本<25.1.1。解决方案:更新conda到25.1.1或更高版本。在cmd命令行以管理员模式启动。
2025-03-29 22:48:26
482
原创 【创新项目实训个人博客】创新实训项目初始化——gitee的使用
Gitee 是一个基于 Git 的代码托管平台,与 GitHub 类似,Gitee 提供了丰富的功能,比如代码仓库的创建、分支管理、代码审查等。
2025-03-17 13:00:00
1017
原创 吐槽强化学习环境稳定性
吐槽一下强化学习环境,调试两三天了,一直以为环境搭错了,哪里没弄好,训练时或者测试时的agent的reward大概只有0-100,保存了训练或者测试的视频发现agent只会刚开始动一下,然后就装死,跑了其他方法又可以用。偶然间修改了一个新的seed就跑起来了,原来一些seed是崩溃的不可用,但是另一种方法在相同seed又是可以的,真玄学。希望有遇到这种问题的人注意一下。
2025-02-17 15:06:22
94
原创 cpu、gpu查看
跟深度学习相关的肯定想查看gpu有关的情况,下面是三种gpu查看方法,非常全面了注意:想要定时刷新以下方法搭配watch方法,例如watch -n 3 nvidia-smi,每隔三秒刷新一次nvidia-smi命令。
2025-02-15 17:41:13
213
原创 Ubuntu服务器设置X11服务
它允许你通过网络将一个图形应用的窗口从远程主机显示到本地。为了实现这一目标,SSH 提供了 X11 转发功能。我们可以通过 ssh -X 或 ssh -Y 命令启用这一功能。当我们在远程服务器上运行需要图形界面的程序时,通常需要使用 SSH 来连接服务器并通过 X11 转发将远程的图形界面显示到本地机器。-Y:启用 X11 转发,并允许不受信的 X11 转发(适用于一些复杂的图形应用)-X:启用 X11 转发,但不允许不受信的 X11 转发。ssh -X -p 端口号 用户名@网址,启用X11转发。
2025-02-14 16:50:10
456
原创 C盘、内存清理指南
大一刚来C盘200多个G,感觉用不完,一直默认安装,现在大三了C盘都爆红了,但是不敢乱删,全是不认识的文件夹,哭了。下面是一些解决办法。
2025-02-11 15:05:07
240
原创 RL-viGen环境
Package Version Editable project location----------------------- --------------- -------------------------------------------absl-py 2.1.0antlr4-python3-runtime 4.8asttokens 3.0.0backcall
2025-02-07 19:02:24
869
原创 如何关闭yolov8预测时的打印输出
yolov8套壳的模型也可以,yolov8每次预测成功就会打印,输入信息,目标数,预测速度,命令行太吵闹了。
2025-02-07 16:07:15
124
转载 deepseek本地部署
最近在玩deepseek和kimi1.5,deepseek是访问太多了还是服务器太次了,一直转圈用不了,打算本地部署一个7B模型。使用ollama+chatbox软件,参考csdn博客。
2025-01-30 20:35:01
641
原创 安利一个扣数据软件
7.左边viewdata,sort by X,处理小数点位数,下载.csv格式,这样我们的数据就扣取完了,对一些非计算机专业的实验数据很有用。4.右边选择automatic extraction自动取点,mask上选pen涂画出线条对应的位置,用color取色笔吸取前景色和背景色。网页版,不卡顿,打点快,开源免费,纯扣数据比origin好用一些,画图还是用origin吧。6.在右边选adjust point上下微调就行,用键盘的↑和↓。3.右边修改坐标轴区间,方便系统帮你算好对应点的坐标。
2025-01-26 17:03:13
274
原创 nvcc -V 和nvidia-smi的cuda version版本不匹配问题
我nvcc -V是10.1版本,但是cuda version是12.4版本,我的pytorch也是12。4版本的,我之前以为没什么关系,网上有说cuda可以与编译器向下兼容的,但是今天安装某程序时出现问题,要求二者一致。看一下环境变量是cuda几的,如果路径中包含 CUDA 10.1 的路径(例如。确保 CUDA 12.4 已正确安装,并且路径存在。以下是简单的解决办法,更新nvcc到12.4版本。),则需要更新为 CUDA 12.4 的路径。如果没有cuda12.4,去cuda官方下载。
2025-01-26 16:51:16
720
原创 ssh远程连接vocode免密登录
命令行创建一个~/.ssh/authorized_keys,把第四步复制的内容粘贴进去,重启vscode就行。网上教程很多,我记录一下。
2025-01-14 17:53:53
190
原创 山东大学计算机网络所有付费资源网址
期末免费的都背不完了,这些收费的更别想了,但是我都搜索了,贴个网址在下面参考一下吧,免费发电的学长学姐还有很多,明年肯定有学长学姐分享更新的。
2025-01-05 21:52:05
244
山东大学软件学院2022级操作系统课设
2025-03-24
山东大学编译原理实验java版
2025-01-30
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人