- 博客(38)
- 收藏
- 关注
原创 undefined symbol: _ZN3c105ErrorC2ENS_14SourceLocationENSt7
问题在flash-attn的版本,大于2.8.0的版本会显示undefined symbol,降到更低的版本例如。
2025-11-19 16:32:20
211
原创 Closed-Loop Evaluation in Robotics: A Practical Template (for openvla + LIBERO)
4)将动作送回仿真器执行;标准闭环评估系统通常采用双环境解耦设计:一个环境运行策略模型(通常依赖 PyTorch、CUDA 等深度学习库),另一个环境运行仿真器(依赖 robosuite、MuJoCo 等物理引擎)。在机器人学习,特别是视觉-语言-动作(VLA)模型的开发中,closed-loop evaluation(闭环评估)是验证策略在动态环境中实际能力的关键环节。综上,一个健壮的闭环评估不仅验证模型能力,也揭示数据、模型、仿真三者之间的鸿沟,是推动策略从“模仿”走向“鲁棒控制”的必要环节。
2025-11-13 22:58:48
326
原创 ERROR: Failed building wheel for egl_probe
please check your cmake version.I can install egl_probe with cmake==3.24.3
2025-11-10 22:57:26
481
原创 QA about Flow Matching Objective
The Standard Flow Matching: “pred_vel” ObjectiveIn the standard Flow Matching framework with a straight-line path zt=(1−t)z0+tx1zt=(1−t)z0+tx1zt=(1−t)z0+tx1:The “pred_data” Objective (Predicting x1 directly)Let’s consider an alternative where you
2025-07-31 16:50:50
769
原创 Flow Model & Flow Matching
Concept:A “flow model,” more precisely known as a Normalizing Flow (NF), is a type of generative model that explicitly learns a probability distribution by transforming a simple, known distribution (e.g., a standard Gaussian) into a complex, target data d
2025-07-30 23:56:37
781
原创 [Bug | Cursor] import error: No module named ‘data‘
【代码】[Bug | Cursor] import error: No module named ‘data‘
2025-07-23 21:29:00
279
原创 [RFT] Why GRPO feels weird / “saddle-point“ intuition
PPO和GRPO是两种强化学习优化方法。PPO通过最大化期望奖励改进策略,使用重要性采样和裁剪机制确保稳定性,依赖标量奖励信号。GRPO则基于偏好学习,通过排名反馈优化策略,鼓励高排名样本并抑制低排名样本,但可能面临鞍点问题和信号扁平化风险。PPO更稳定但易受噪声奖励影响,GRPO依赖排名质量且缺乏明确的优势评估。两种方法在反馈类型、损失函数和稳定性方面存在显著差异。
2025-07-11 15:25:06
566
原创 [RL迷思] Supervised Learning vs. RL(Instructing the Model via Rewards)
【代码】[RL迷思] Supervised Learning vs. RL(Instructing the Model via Rewards)
2025-07-11 15:17:12
826
原创 [bug] Failed to build installable wheels for some pyproject.toml based projects (cython_bbox)
【代码】[bug] Failed to build installable wheels for some pyproject.toml based projects (cython_bbox)
2025-07-06 13:49:06
384
原创 accidentally did git add . and staged/committed a huge file
【代码】accidentally did git add . and staged a huge file。
2025-04-14 17:05:19
396
原创 [vscode] 取消点击文件目录自动跳转
vscode只要打开某个文件,目录就会自动跳转到文件的位置,有时候文件太多了总是跳来跳去的,影响找文件,还容易发晕(是的我的小脑打不了一点射击游戏)
2025-04-02 16:30:52
1044
1
原创 [vscode] LD_LIBRARY_PATH vs. VSCode environment mismatch
【代码】[vscode] LD_LIBRARY_PATH vs. VSCode environment mismatch。
2025-03-30 13:11:36
398
原创 [python] No matching distribution found for yaml
【代码】[python] No matching distribution found for yaml。
2025-03-30 12:38:49
439
原创 [VScode | extension] ❌ no space left on device
【代码】[VScode | extension] ❌ no space left on device。
2025-03-25 11:20:41
719
原创 Ubuntu terminus 多窗口分屏tmux
在远程登陆Linux时,要远程启动多个程序,分屏显得很重要。在这里小记一下几种简单的分屏命令。1、terminal分屏。
2025-03-20 23:24:36
599
原创 [linux] Why Ctrl+C Doesn’t Fully Stop ProcessPoolExecutor?
【代码】[linux] Why Ctrl+C Doesn’t Fully Stop ProcessPoolExecutor?
2025-03-17 14:30:19
531
原创 [Bug|Zed] No module named ‘pyzed.sl‘
pytorch whl download: https://download.pytorch.org/whl/cu118
2024-08-21 15:31:49
1236
原创 [cu118] 资源列表
pytorch whl download: https://download.pytorch.org/whl/cu118
2024-08-20 22:27:13
207
原创 [Bug|VSCode] ssh remote server一直断连重启
问题:vs code remote server 连接远程机器的时候过两分钟就断连一次,dubug到一半显示“意外中断”,全部重来。如果跳错"cannot remove [file]: Device or resource busy",去查看堵塞的进程,参考代码。在别的地方ssh到远程机器,比如terminal,然后删除文件夹~/.vscode-server,参考代码。,21年发布的,到24年下面13个回复都是在谢他。完全退出VSCode。如果退不出就强制退出去。然后删掉那些进程,重新尝试删除文件夹。
2024-08-13 13:36:37
2324
1
原创 CUDA迷思| torch.version.cuda; nvcc -V; nvidia-smi分别是什么
torch.version.cuda 只是定义为字符串。它不查询任何内容,不会告诉您安装了哪个版本的 CUDA。它仅告诉您安装的 PyTorch 适用于该 (10.2) 版本的 CUDA。nvidia-smi 的输出是显卡的硬件信息,它代表了Driver CUDA版本,与框架程序的Runtime CUDA并不相同。可以理解为能够匹配的最高CUDA版本。但您系统上实际运行的 CUDA 版本是 11.8。
2024-06-10 20:02:44
809
2
原创 [Bug|NVIDIA GeForce RTX 4090 with CUDA capability sm_89 is not compatible with the current PyTorch]
原文链接:https://blog.youkuaiyun.com/festaw/article/details/137599133。对应8.9是cuda11.8,只能高不能低。找到你的显卡对应算力,如4090对应8.9。2.算力对应的cuda版本。
2024-06-05 15:43:09
4204
原创 [Bug|RuntimeError: CuDA error: no kernel image is available for execution on the device]
一步一步排查,如果都能正常运行就OK了。还可以自行去pytorch的。大概率是cuda和torch版本不匹配。检查自己的版本是否合适。
2024-06-05 11:26:55
350
原创 [VScode Bug]|Python debugger无法用于py36
Python Debugger 2023不再支持Python<=3.6的版本。在Extension内有一个专用<=py36的debugger,搜索。
2024-05-30 13:21:29
587
原创 [Linux Bug | ModuleNotFoundError: No module named ‘mathutils‘]
Mathutils 用pip和conda都没法下载。
2024-05-29 17:25:13
935
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅