自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(65)
  • 收藏
  • 关注

原创 大模型服务由N卡适配曙光K100卡

N卡适配——>曙光K100曙光K100 是由中国中科曙光(Sugon)推出的一款高性能计算(HPC)或人工智能(AI)加速卡,主要用于数据中心、科学计算、AI训练与推理等场景。

2025-12-05 10:38:57 630

原创 LlamaFactory微调Qwen3-0.6B大模型步骤

(注:localhost:8103 指的是程序启动机器自身的8103端口,云上的用户可能无法通过本地的笔记本电脑直接访问,需要找云厂商获取域名和端口号的一些配置关系进行配置)4、加载自定义数据集,符合alpaca格式,并在dataset_info.json中进行注册。2、下载LLaMA-Factory-man项目。创建qwen3_0.6B.yaml,里面填入。1、下载Qwen3-0.6B大模型。6、验证微调后的模型效果。3、验证模型推理的效果。

2025-12-02 19:03:54 377

原创 上传本地代码至github

🎯 本地代码上传 GitHub 完整流程第 1 步:本地 Git 初始化(如果项目还未 Git 化)bash。

2025-11-29 21:10:21 354

原创 记录一下windows系统安装wsl的步骤

*WSL(Windows Subsystem for Linux)**是微软开发的一项功能,允许你在 Windows 系统内部直接运行 Linux 环境,无需安装虚拟机或双系统。支持 GUI 应用(WSLg):从 WSL2 开始,配合 WSLg,还能运行 Linux 图形界面程序(比如 GIMP、VS Code 等)。WSL2:基于轻量级虚拟机,运行真实的 Linux 内核,性能更强,支持完整系统调用,推荐用于开发、训练模型等任务。

2025-11-23 21:59:17 290

原创 Agentic AI 与 AI Agent的核心区别

一文读懂Agentic AI 与 AI Agent的核心区别

2025-10-28 23:00:54 228 1

原创 LLM和智能体的区别

大模型与AI Agent的关系,本质是AI技术从感知智能(理解语言)向认知智能(自主决策)与行动智能(落地执行)的进化。前者解决了“AI能听懂人话”的问题,后者突破了“AI能自己做事”的瓶颈。对于企业而言,理解二者的差异与协同逻辑,不仅是选择技术方案的前提,更是把握AI时代机遇的关键。

2025-10-28 22:39:13 117

原创 使用MS-SWIF框架对大模型进行SFT微调

报错:ValueError: Bfloat16 is only supported on GPUs with compute capability of at least 8.0. Your Tesla V100S-PCIE-32GB GPU has compute capability 7.0. You can use float16 instead by explicitly setting the。

2025-09-05 10:56:18 957

原创 从 PPO、DPO 到 GRPO:万字长文详解大模型训练中的三大关键算法

写的太好了!!

2025-09-04 16:06:22 292

原创 【配置 PyCharm 连接远程服务器进行开发和调试的完整流程】

1.PyCharm Professional(社区版不支持远程解释器)2、然后Add New_interpreter,选择on ssh;2.代码在本地目录里面,可以同步上传远程服务器。1、在本地使用PyCharm打开工程代码;3.宿主机上安装了conda 环境。3、然后即可进行debug;

2025-08-27 15:30:32 301

原创 强化学习之美

介绍了强化学习的起源以及发展背景。

2022-10-19 22:45:49 314

原创 RL论文数据图绘制

记录RL论文数据图的绘制方法

2022-10-12 16:17:58 455 1

原创 导出TensorBoard中的所有数据并平滑处理

将tensorboard生成的数据平滑处理

2022-10-10 20:06:15 1247

原创 互联网知识点整理

整理了软件测试知识点

2022-09-08 16:31:08 1312

原创 对多智能体强化学习算法MADDPG的理解

介绍了本人对MADDPG算法的理解

2022-07-10 20:06:53 5600 3

原创 tf.AUTO_REUSE的作用

记录tensorflow基本用法

2022-07-09 15:32:10 586

原创 word使用技巧

为了方便日后处理文档,总结offic软件使用技巧。

2022-07-09 14:17:15 209

原创 深度学习中的标量、向量、矩阵和张量的区别

区别深度学习里面的标量、向量、矩阵、张量

2022-07-07 21:57:43 1662

原创 元强化学习

元强化学习

2022-05-22 16:29:39 724

原创 课程学习邂逅强化学习

一篇综述带你全面了解课程学习(Curriculum Learning)课程强化学习课程学习邂逅多智能体强化学习

2022-05-22 16:02:06 284

原创 Python导入自定义模块方法

添加链接描述

2022-05-03 14:22:50 713

原创 linux python解决中文字体Font family [‘sans-serif‘] not found. Falling back to DejaVu Sans

点击此处

2022-04-24 22:27:25 1730

原创 python路径拼接os.path.join()函数的用法

os.path.join()函数:用来连接路径名组件1.如果各组件名首字母不包含‘/’,则函数会自动加上。2.如果有一个组件是一个绝对路径,则在它之前的所有组件均会被舍弃。3.如果最后一个组件为空,则生成路径以一个‘/ ’分隔符结尾...

2022-04-22 20:46:36 3133

原创 大规模多智能体强化学习资料整理

2020年,Multi-Agent RL领域的主流研究方向有哪些?【多智能体强化学习】新手入门算法论文大总结多智能体强化学习(持续更新)多智能体强化学习的几种Best Practice处理大规模多智能体强化学习的方方法:1)从小规模的系统开始学习,逐渐递进到大规模系统...

2022-03-09 21:13:02 985

原创 pycharm快捷键

pycharm快捷键

2022-02-14 21:20:27 436

原创 阿豪找工作

2021年《财富》世界500强揭晓!中国143家公司上榜2021世界500强2021中国500强选择国企、私企、外企,5年后的差距有多大?国企和央企的区别国企包括中央所属国有企业和地方所属国有企业,即央企和地方国企统称为国企。央企可以分为四大类:实业类金融类(四大行)文化类行政类(烟草)央企名录南京:中国航天科工集团8511研究所机关单位与事业单位的区别机关单位:机关单位,指国家机关,指从事国家管理和行使国家权力的机关。包括国家元首、权力机关、行政机关、审判机关、公安机关、检察

2022-01-17 17:22:38 413

原创 combat 仿真系统资料

扩展防空仿真系统(EADSIM)EADSIM培训教材Teledyne Brown Engineering公司书籍:大型仿真系统目前市面上能够使用的作战仿真系统

2021-11-07 18:40:01 922

原创 阿木实验室Prometheus项目实践总结

基础测试题

2021-11-05 16:35:11 2179

原创 研究入门指南

研究入门指南知网引文网络使用指南

2021-10-29 10:40:27 148

原创 高性能分布式执行框架——Ray

Ray简单介绍

2021-10-20 11:11:25 185

原创 深度学习资料整理

简介课程目录课程笔记课程作业

2021-09-28 16:14:31 162

原创 吴恩达Coursera深度学习课程

快速入门深度学习:网课+笔记+作业+代码 一套流程基础肯定很扎实了

2021-09-28 16:04:04 216

原创 连接远程服务器

VM16连接远程服务器

2021-09-01 15:20:19 94

原创 PX4控制方式总结

姿态控制的流程图,外环产生角速率,内环产生期望加速度(电机推力)。外环根据期望的位置、速度,计算输出相应的姿态信息。外环输出的姿态信息作为内环的输入,内环计算出期望的加速度。ROS-mavros-PX4加速度控制要写的飞控算法本来的输入是roll、pitch以及推进力,由于PX4不支持输入具体大小的推进力,改用三方向加速度(可用旋转矩阵进行变换)进行控制。但是PX4的setpoint_accel实际控制效果很差,github上也有人说它不可用。解决方案:参考阿木实验室的px4_command,使.

2021-08-28 17:20:53 2507 2

原创 gazebo/set_model_state话题通过位姿驱动无人机模型

ROS官方demoROS_gazebo 设置/获取模型状态 set_model_state/get_model_state自己可以写一个模拟无人机运动的脚本(订阅控制指令,输出无人机状态),输出的状态用gazebo/set_model_state更新无人机的位置。

2021-08-07 17:04:38 828

原创 Gazebo 多机仿真启动过程分析

官网链接1. Gazebo 模型文件1)gazebo模型被定义为xacro文件,xacro文件可用来生成urdf文件。路径如下:每个gazebo模型应该有一个名为 mavlink_udp_port 的参数,它定义了 Gazebo 与 PX4 节点通信的 UDP 端口。 模型的 xacro 文件将用于生成包含您选择的 UDP 端口的 urdf 模型。 要定义 UDP 端口,请在启动文件中为每个车辆设置 mavlink_udp_port,请参见此处作为示例。2. px4_sitl1)px4_sit

2021-08-05 22:00:59 1062

原创 利用ROS多机将PX4_sitl的各个模块分布到不同计算机

px4仿真官网链接首先明确px4_sitl与各个模块的连接方式,包括API/offboard(MAVROS),GCS(qgc)是通过udp端口连接,仿真器(gazebo)是通过tcp端口连接。测试一:ROS多机下,主机启动px4_sitl ,从机启动Mavros具体操作步骤:首先配置ROS多机进入主机的px4_sitl脚本文件rcs设置参数 param set MAV_BROADCAST 1在主机启动 roslaunch px4 posix_sitl.launch (px4_sitl)在

2021-08-05 17:01:57 1096

原创 ROS多机

我想尝试100架无人机的仿真,请问我可以用ROS多机连上多台电脑,只在master主机上的gazebo显示我的无人机集群吗?其他的电脑仅仅用作规划、控制、算法使用?请问理论上这样可行吗?需要注意哪些关键点呢?...

2021-07-07 11:04:44 236

原创 ROS、PX4联合仿真时提高仿真速度

请问如何提高prometheus的仿真速度?最近在用阿木实验室的prometheus项目做开发,想提高无人机的仿真速度我查找相关资料发现有两种方式:1)一种是改变PX4_sitl的速度,即在仿真的launch 文件开头调用PX4的rcs文件中的参数PX4_SIM_SPEED_FACTOR,这个应该是和电脑性能有关,电脑无法带动系统会自动降低;2)另一种是提高gazebo的仿真速度,通过修改world文件中的<real_time_factor>和<real_time_update_r

2021-07-07 10:56:26 598

原创 Ubuntu18.04安装ROS Melodic

Ubuntu18.04安装ROS Melodic(详细,亲测安装完成,有清晰的截图步骤)ROS官网安装注意:选择是否安装desktop-full 版本,即选择是否一并安装gazebo;Gazebo的卸载与重装ros 安装及卸载 gazebo7/8/9,gazebo版本升级与降级...

2021-07-06 11:00:10 180

原创 Python3多进程multiprocessing模块的使用

Python3多进程multiprocessing模块的使用

2021-07-04 15:29:42 88

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除