自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 Install Miniforge

【代码】Install Miniforge。

2025-12-01 15:35:03 298

原创 undefined symbol: _ZN3c105ErrorC2ENS_14SourceLocationENSt7

问题在flash-attn的版本,大于2.8.0的版本会显示undefined symbol,降到更低的版本例如。

2025-11-19 16:32:20 211

原创 Closed-Loop Evaluation in Robotics: A Practical Template (for openvla + LIBERO)

4)将动作送回仿真器执行;标准闭环评估系统通常采用双环境解耦设计:一个环境运行策略模型(通常依赖 PyTorch、CUDA 等深度学习库),另一个环境运行仿真器(依赖 robosuite、MuJoCo 等物理引擎)。在机器人学习,特别是视觉-语言-动作(VLA)模型的开发中,closed-loop evaluation(闭环评估)是验证策略在动态环境中实际能力的关键环节。综上,一个健壮的闭环评估不仅验证模型能力,也揭示数据、模型、仿真三者之间的鸿沟,是推动策略从“模仿”走向“鲁棒控制”的必要环节。

2025-11-13 22:58:48 326

原创 ERROR: Failed building wheel for egl_probe

please check your cmake version.I can install egl_probe with cmake==3.24.3

2025-11-10 22:57:26 481

原创 Linux 容器安装 conda 和 pip

先进入容器,运行:📌 假设你是 Ubuntu/Debian(最常见),以下以 Ubuntu 为例。

2025-11-01 14:15:30 282

原创 安装pytorch3d

【代码】安装pytorch3d。

2025-10-29 22:20:38 323

原创 flash-attn安装卡在Building wheel for flash-attn (setup.py)

都卡在这一步不动了。

2025-10-29 21:54:35 560

原创 main设计

2025-10-14 16:43:17 120

原创 qwen2.5vl 模型配置记录

【代码】qwen2.5vl 记录。

2025-10-13 19:45:53 261

原创 [Metrics] RMSE vs ADE

【代码】[Metrics] RMSE vs ADE。

2025-08-12 15:09:14 713

原创 QA about Flow Matching Objective

The Standard Flow Matching: “pred_vel” ObjectiveIn the standard Flow Matching framework with a straight-line path zt​=(1−t)z0​+tx1zt​=(1−t)z0​+tx1zt​=(1−t)z0​+tx1​:The “pred_data” Objective (Predicting x1​ directly)Let’s consider an alternative where you

2025-07-31 16:50:50 769

原创 Flow Model & Flow Matching

Concept:A “flow model,” more precisely known as a Normalizing Flow (NF), is a type of generative model that explicitly learns a probability distribution by transforming a simple, known distribution (e.g., a standard Gaussian) into a complex, target data d

2025-07-30 23:56:37 781

原创 CVAE 回顾版

L​qz∣x∥pz))z∣x​logpx∣z)]x∣zx∣zx∣zD​z2i​xi​−μD​z))2D​z。

2025-07-30 23:47:45 1068

原创 [Bug | Cursor] import error: No module named ‘data‘

【代码】[Bug | Cursor] import error: No module named ‘data‘

2025-07-23 21:29:00 279

原创 【转载】零推导理解Diffusion和Flow Matching - 王峰

记录一下留作笔记。

2025-07-20 22:17:54 123

原创 [RFT] Why GRPO feels weird / “saddle-point“ intuition

PPO和GRPO是两种强化学习优化方法。PPO通过最大化期望奖励改进策略,使用重要性采样和裁剪机制确保稳定性,依赖标量奖励信号。GRPO则基于偏好学习,通过排名反馈优化策略,鼓励高排名样本并抑制低排名样本,但可能面临鞍点问题和信号扁平化风险。PPO更稳定但易受噪声奖励影响,GRPO依赖排名质量且缺乏明确的优势评估。两种方法在反馈类型、损失函数和稳定性方面存在显著差异。

2025-07-11 15:25:06 566

原创 [RL迷思] Supervised Learning vs. RL(Instructing the Model via Rewards)

【代码】[RL迷思] Supervised Learning vs. RL(Instructing the Model via Rewards)

2025-07-11 15:17:12 826

原创 [RL迷思] RAG vs RLHF vs RFT

【代码】[RL迷思] RAG vs RLHF vs RFT。

2025-07-11 15:09:44 772

原创 [bug] Failed to build installable wheels for some pyproject.toml based projects (cython_bbox)

【代码】[bug] Failed to build installable wheels for some pyproject.toml based projects (cython_bbox)

2025-07-06 13:49:06 384

原创 Don‘t track .DS_Store in Git

【代码】Don‘t track .DS_Store in Git。

2025-04-15 14:08:11 150

原创 accidentally did git add . and staged/committed a huge file

【代码】accidentally did git add . and staged a huge file。

2025-04-14 17:05:19 396

原创 [vscode] 取消点击文件目录自动跳转

vscode只要打开某个文件,目录就会自动跳转到文件的位置,有时候文件太多了总是跳来跳去的,影响找文件,还容易发晕(是的我的小脑打不了一点射击游戏)

2025-04-02 16:30:52 1044 1

原创 [vscode] LD_LIBRARY_PATH vs. VSCode environment mismatch

【代码】[vscode] LD_LIBRARY_PATH vs. VSCode environment mismatch。

2025-03-30 13:11:36 398

原创 [python] No matching distribution found for yaml

【代码】[python] No matching distribution found for yaml。

2025-03-30 12:38:49 439

原创 [VScode | extension] ❌ no space left on device

【代码】[VScode | extension] ❌ no space left on device。

2025-03-25 11:20:41 719

原创 Ubuntu terminus 多窗口分屏tmux

在远程登陆Linux时,要远程启动多个程序,分屏显得很重要。在这里小记一下几种简单的分屏命令。1、terminal分屏。

2025-03-20 23:24:36 599

原创 [linux] Why Ctrl+C Doesn’t Fully Stop ProcessPoolExecutor?

【代码】[linux] Why Ctrl+C Doesn’t Fully Stop ProcessPoolExecutor?

2025-03-17 14:30:19 531

原创 [Linux] 新机器设置实录

linux 设置

2025-03-11 21:59:33 137

原创 [Bug|Zed] No module named ‘pyzed.sl‘

pytorch whl download: https://download.pytorch.org/whl/cu118

2024-08-21 15:31:49 1236

原创 [cu118] 资源列表

pytorch whl download: https://download.pytorch.org/whl/cu118

2024-08-20 22:27:13 207

原创 [Bug|VSCode] ssh remote server一直断连重启

问题:vs code remote server 连接远程机器的时候过两分钟就断连一次,dubug到一半显示“意外中断”,全部重来。如果跳错"cannot remove [file]: Device or resource busy",去查看堵塞的进程,参考代码。在别的地方ssh到远程机器,比如terminal,然后删除文件夹~/.vscode-server,参考代码。,21年发布的,到24年下面13个回复都是在谢他。完全退出VSCode。如果退不出就强制退出去。然后删掉那些进程,重新尝试删除文件夹。

2024-08-13 13:36:37 2324 1

原创 CUDA迷思| torch.version.cuda; nvcc -V; nvidia-smi分别是什么

torch.version.cuda 只是定义为字符串。它不查询任何内容,不会告诉您安装了哪个版本的 CUDA。它仅告诉您安装的 PyTorch 适用于该 (10.2) 版本的 CUDA。nvidia-smi 的输出是显卡的硬件信息,它代表了Driver CUDA版本,与框架程序的Runtime CUDA并不相同。可以理解为能够匹配的最高CUDA版本。但您系统上实际运行的 CUDA 版本是 11.8。

2024-06-10 20:02:44 809 2

原创 [Bug|更新cuda版本]

参考Wing以一的。

2024-06-05 16:29:07 179

原创 [Bug|NVIDIA GeForce RTX 4090 with CUDA capability sm_89 is not compatible with the current PyTorch]

原文链接:https://blog.youkuaiyun.com/festaw/article/details/137599133。对应8.9是cuda11.8,只能高不能低。找到你的显卡对应算力,如4090对应8.9。2.算力对应的cuda版本。

2024-06-05 15:43:09 4204

原创 [Bug|RuntimeError: CuDA error: no kernel image is available for execution on the device]

一步一步排查,如果都能正常运行就OK了。还可以自行去pytorch的。大概率是cuda和torch版本不匹配。检查自己的版本是否合适。

2024-06-05 11:26:55 350

原创 [Bug|No module named ‘rvo2‘]

用pip和conda都不能下载。

2024-05-31 15:57:27 1016

原创 [VScode Bug]|Python debugger无法用于py36

Python Debugger 2023不再支持Python<=3.6的版本。在Extension内有一个专用<=py36的debugger,搜索。

2024-05-30 13:21:29 587

原创 [Linux Bug | ModuleNotFoundError: No module named ‘mathutils‘]

Mathutils 用pip和conda都没法下载。

2024-05-29 17:25:13 935

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除