星楠_001-优快云博客

原创 model.generate()参数用处，该怎么配合使用

囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊囊😡囊囊囊😡囊囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤

2025-10-05 19:01:43 770

原创 logits和softmax分布

logits是模型的输出分数在大语言模型里，logits 是每个 token 的“相对偏好分数”，可以是正数、负数或零。

2025-10-02 18:17:05 228

原创 WslRegisterDistribution failed with error: 0x800701bcError: 0x800701bc WSL 2 ??????????????????

导致无法注册 Linux 发行版。点击第一个安装确定完成后面我记录一下win wsl安装过程1.以管理员身份打开 PowerShell。

2025-09-26 14:22:17 341

原创如何unsloth导入模型部署如何理解tokenizer输出详解代码块参数和作用

本文详细介绍了大语言模型文本生成的关键步骤和参数配置，主要包括四个核心部分：1）模型加载与量化设置；2）文本分词与编码过程；3）文本生成策略与参数控制；4）结果解码与后处理。重点解析了temperature、top_k、top_p等采样参数的作用，以及beam search、early stopping等生成策略的应用场景。文章还提供了不同需求的生成模板（如长文本、短答、严谨回答、创意回答），并演示了tokenizer.decode()的工作原理和参数设置。最后指出模型输出质量取决于参数调优能力，为后续微调

2025-09-10 10:00:00 735

原创 unsloth FastLanguageModel类主要函数详解,具体作用和参数

Unsloth框架中的FastLanguageModel类提供了高效的大语言模型处理方案，主要包括四大核心功能：模型加载：支持4/8-bit量化加载，显著降低显存占用； LoRA微调：通过轻量适配器实现高效参数更新，典型配置为r=16的秩分解；推理优化：合并LoRA权重后推理速度提升2倍；词表扩展：支持添加领域专用token和特殊符号。该方案通过量化技术将8B参数模型的显存需求从30GB降至6GB，配合梯度检查点技术，在单张消费级GPU上即可实现大模型微调，为资源受限场景提供了实用解决方案。

2025-09-07 21:22:07 1199

原创 w11快速搭建Unsloth环境与Qwen3模型微调

本文介绍了使用Unsloth框架对通义千问Qwen3-4B模型进行微调的完整流程。主要包括：1）创建conda环境并安装必要的依赖项；2）下载模型和准备数据集；3）进行LoRA微调训练；4）测试微调后的模型效果。其中重点展示了数据格式处理、训练参数配置以及交互式对话测试方法。文章指出，虽然基础对话功能已实现，但创造性输出仍需更专业的数据集支持。最后提到将后续解析代码原理，采用理论与实践交替的讲解方式。

2025-09-04 17:51:47 408

原创 CUDA error (C:/a/xformers/xformers/third_party/flash-attention/hopper\flash_fwd_launch_template.h:18

摘要：在Win11系统下使用英伟达50系显卡运行Unsloth训练Qwen3-4B模型时，出现环境与CUDA冲突问题。解决方案是卸载可选的xformers组件，该组件与当前配置不兼容。官方尚未提供具体修复方法，建议参考Unsloth文档关于Blackwell和RTX50系列显卡的说明。关键参数包括4-bit量化(max_seq_length=200)和生成设置(max_new_tokens=64, temperature=0.7)。注意模型路径需使用原始路径或HuggingFace仓库名"Qwen

2025-08-29 19:30:39 972

原创最简单的多cuda兼容windows11

本文介绍了在已安装CUDA12.9的情况下配置CUDA12.6环境的步骤。重点包括：1）自定义安装CUDA12.6时仅选择前三个组件避免冲突；2）安装cuDNN8.9.7并复制文件到CUDA目录；3）通过conda安装PyTorch2.6及相关组件；4）测试CUDA可用性；5）说明后续通过环境变量切换CUDA版本的方法（如修改PATH中版本路径顺序）。整个过程确保了项目环境对特定CUDA版本的兼容性。

2025-08-29 01:31:14 255

原创 ubuntu22.04 安装 ORB-SLAM3 ROS2

ORBSLAM3 安装及测试教程（Ubuntu22.04）

2025-05-09 15:51:37 1602 12

原创 what(): Specified format `yuyv2rgb` is unsupported by the selected device `/dev/video1`[ros2run]

在测试ROS2摄像头时，运行usb_cam_node_exe时出现错误，提示指定的格式yuyv2rgb不被设备/dev/video1支持。解决方法是在配置文件params_1.yaml中将pixel_format修改为"yuyv"，然后重新运行程序。程序会列出设备支持的所有格式，用户可以根据设备兼容的格式进行修改并重新运行。

2025-05-09 15:25:12 547

原创 tx2 ubuntu 18.04 aarch64 安装tensorflow2.10

miniconda版本选择： https://repo.anaconda.com/miniconda/vscode安装包。

2025-05-08 10:07:36 235

原创 ubuntu22 ORB-SLAM3 ROS2 报错记录#include “camera_info_manager/camera_info_manager.hpp“报错和No such file or

【代码】ubuntu22 ORB-SLAM3 ROS3 报错记录。

2024-11-18 09:51:54 908

原创 opencv TypeError: Can‘t parse ‘center‘. Sequence item with index 0 has a wrong type

需要Point2f类型，但是python创建不了这个类型,所以用numpy类型代替。python 计算矩阵时报错，根据报错线索查看。

2024-10-28 09:42:17 336

原创人脸识别github库

该代码库在 Ubuntu 14.04 下使用 Tensorflow r1.7 和 Python 2.7 和 Python 3.5 进行测试。InsightFace 高效实现了丰富的先进的人脸识别、人脸检测和人脸对齐算法，并针对训练和部署进行了优化。是一个开源的2D&3D深度人脸分析工具箱，主要基于PyTorch和MXNet。您将能够看到终端输出一个 512 个元素的数组，表示嵌入的面部特征。您将能够看到它输出上述架构的日志。0. Python 包模型。3. 人脸对齐模型。

2024-10-23 17:11:11 781 2

原创复现BundleSDF官方演示，一种对视频中的物体进行3D重建

他们提出了一种近乎实时的方法，用于从单目 RGBD 视频序列中对未知物体进行 6-DoF 跟踪，同时对该物体进行神经 3D 重建。我们的方法适用于任意刚性物体，即使在视觉纹理基本不存在的情况下也是如此。假设该物体仅在第一帧中被分割。不需要其他信息，也不对交互代理做出任何假设。我们方法的关键是神经对象场，它与姿势图优化过程同时学习，以便将信息稳健地积累成一致的 3D 表示，同时捕捉几何和外观。自动维护一个动态的姿势记忆帧池，以促进这些线程之间的通信。

2024-06-11 11:01:55 3670 17

原创 conda复现Instruct-NeRF2NeRF

有conda复现Instruct-NeRF2NeRF,大抵是指令编辑场景

2024-05-13 08:58:44 1269 14

原创 javaspring绝对路径和加载类路径的区别

这个就相当于放到了缓存区，只要修改了，就会重启javaspring。对象时，你需要提供一个字符串参数，这个字符串创建是资源在类路径下的路径。是一个用于加载类路径（classpath）下的资源的类。然后在javaspring，读取打印出来，却是覆盖前的文件内容。在写项目的时候，用绝对路径来写入json文件。在Spring框架中，

2024-04-05 23:12:37 288 2

原创 yolov8.1训练自己的数据识别游戏人物的头部。

用yolov8.1来识别游戏人物的头部，使用pytoch-gpu，来训练。labelme图像标注。全网首发yolov8.1conda教程

2024-01-18 22:28:38 1923 8

原创 train: WARNING ⚠️ 0.jpg: ignoring corrupt image/label: could not convert string to float: ‘head‘

根据yaml文件中画标签为0,1,2,3这样的，再通过yaml，转换为str。yolov8,训练时候报错，原因是labelme画标签是使用str类型。

2024-01-18 14:01:50 3303 5

原创 $Bitmap中有标记为已使用的未用簇。簇号:4446 $MFT位图中有标记为已使用的未用文件记录。文件:2143

3，回车，在命令行中输入“chkdsk /f /x c:”,最后的c:替换为需要检查的盘符。用分盘工具的时候分来分去的很开心，然后分一下然后把文件移过去。2，解决方法:使用cmd命令chkdsk。在开始菜单-运行中输入cmd。1，第一步检测提示"$Bitmap 有标记已使用的未用簇"。在网上搜的怎么都看不懂，终于找到一篇试试。然后就可以继续分区啦。

2024-01-14 00:40:28 18538 12

原创 w11 conda 虚拟环境cuda+cudnn+tensorflow-gpu(在conda里下cuda和cudnn)

用conda下载cuda和cudnn，可以不用改本地cuda

2024-01-14 00:25:40 1462 2

原创 coco128数据集下载连接

https://ultralytics.com/assets/coco128.zip

2024-01-08 11:53:45 3145

agoodtimeo的博客