自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 model.generate()参数用处,该怎么配合使用

囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊囊😡囊囊囊😡囊囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡囊囊囊😡饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿啊🤯饿阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤阿巴🤤

2025-10-05 19:01:43 770

原创 logits和softmax分布

logits是模型的输出分数在大语言模型里,logits 是每个 token 的“相对偏好分数”,可以是正数、负数或零。

2025-10-02 18:17:05 228

原创 WslRegisterDistribution failed with error: 0x800701bcError: 0x800701bc WSL 2 ??????????????????

导致无法注册 Linux 发行版。点击第一个安装确定完成后面我记录一下win wsl安装过程1.以管理员身份打开 PowerShell。

2025-09-26 14:22:17 341

原创 如何unsloth导入模型部署 如何理解tokenizer输出 详解代码块参数和作用

本文详细介绍了大语言模型文本生成的关键步骤和参数配置,主要包括四个核心部分:1)模型加载与量化设置;2)文本分词与编码过程;3)文本生成策略与参数控制;4)结果解码与后处理。重点解析了temperature、top_k、top_p等采样参数的作用,以及beam search、early stopping等生成策略的应用场景。文章还提供了不同需求的生成模板(如长文本、短答、严谨回答、创意回答),并演示了tokenizer.decode()的工作原理和参数设置。最后指出模型输出质量取决于参数调优能力,为后续微调

2025-09-10 10:00:00 735

原创 unsloth FastLanguageModel类主要函数详解,具体作用和参数

Unsloth框架中的FastLanguageModel类提供了高效的大语言模型处理方案,主要包括四大核心功能: 模型加载:支持4/8-bit量化加载,显著降低显存占用; LoRA微调:通过轻量适配器实现高效参数更新,典型配置为r=16的秩分解; 推理优化:合并LoRA权重后推理速度提升2倍; 词表扩展:支持添加领域专用token和特殊符号。 该方案通过量化技术将8B参数模型的显存需求从30GB降至6GB,配合梯度检查点技术,在单张消费级GPU上即可实现大模型微调,为资源受限场景提供了实用解决方案。

2025-09-07 21:22:07 1199

原创 w11快速搭建Unsloth环境与Qwen3模型微调

本文介绍了使用Unsloth框架对通义千问Qwen3-4B模型进行微调的完整流程。主要包括:1)创建conda环境并安装必要的依赖项;2)下载模型和准备数据集;3)进行LoRA微调训练;4)测试微调后的模型效果。其中重点展示了数据格式处理、训练参数配置以及交互式对话测试方法。文章指出,虽然基础对话功能已实现,但创造性输出仍需更专业的数据集支持。最后提到将后续解析代码原理,采用理论与实践交替的讲解方式。

2025-09-04 17:51:47 408

原创 CUDA error (C:/a/xformers/xformers/third_party/flash-attention/hopper\flash_fwd_launch_template.h:18

摘要:在Win11系统下使用英伟达50系显卡运行Unsloth训练Qwen3-4B模型时,出现环境与CUDA冲突问题。解决方案是卸载可选的xformers组件,该组件与当前配置不兼容。官方尚未提供具体修复方法,建议参考Unsloth文档关于Blackwell和RTX50系列显卡的说明。关键参数包括4-bit量化(max_seq_length=200)和生成设置(max_new_tokens=64, temperature=0.7)。注意模型路径需使用原始路径或HuggingFace仓库名"Qwen

2025-08-29 19:30:39 972

原创 最简单的多cuda兼容windows11

本文介绍了在已安装CUDA12.9的情况下配置CUDA12.6环境的步骤。重点包括:1)自定义安装CUDA12.6时仅选择前三个组件避免冲突;2)安装cuDNN8.9.7并复制文件到CUDA目录;3)通过conda安装PyTorch2.6及相关组件;4)测试CUDA可用性;5)说明后续通过环境变量切换CUDA版本的方法(如修改PATH中版本路径顺序)。整个过程确保了项目环境对特定CUDA版本的兼容性。

2025-08-29 01:31:14 255

原创 ubuntu22.04 安装 ORB-SLAM3 ROS2

ORBSLAM3 安装及测试教程(Ubuntu22.04)

2025-05-09 15:51:37 1602 12

原创 what(): Specified format `yuyv2rgb` is unsupported by the selected device `/dev/video1`[ros2run]

在测试ROS2摄像头时,运行usb_cam_node_exe时出现错误,提示指定的格式yuyv2rgb不被设备/dev/video1支持。解决方法是在配置文件params_1.yaml中将pixel_format修改为"yuyv",然后重新运行程序。程序会列出设备支持的所有格式,用户可以根据设备兼容的格式进行修改并重新运行。

2025-05-09 15:25:12 547

原创 tx2 ubuntu 18.04 aarch64 安装tensorflow2.10

miniconda版本选择: https://repo.anaconda.com/miniconda/vscode安装包。

2025-05-08 10:07:36 235

原创 ubuntu22 ORB-SLAM3 ROS2 报错记录#include “camera_info_manager/camera_info_manager.hpp“报错和No such file or

【代码】ubuntu22 ORB-SLAM3 ROS3 报错记录。

2024-11-18 09:51:54 908

原创 opencv TypeError: Can‘t parse ‘center‘. Sequence item with index 0 has a wrong type

需要Point2f类型,但是python创建不了这个类型,所以用numpy类型代替。python 计算矩阵时报错,根据报错线索查看。

2024-10-28 09:42:17 336

原创 人脸识别github库

该代码库在 Ubuntu 14.04 下使用 Tensorflow r1.7 和 Python 2.7 和 Python 3.5 进行测试。InsightFace 高效实现了丰富的先进的人脸识别、人脸检测和人脸对齐算法,并针对训练和部署进行了优化。是一个开源的2D&3D深度人脸分析工具箱,主要基于PyTorch和MXNet。您将能够看到终端输出一个 512 个元素的数组,表示嵌入的面部特征。您将能够看到它输出上述架构的日志。0. Python 包模型。3. 人脸对齐模型。

2024-10-23 17:11:11 781 2

原创 复现BundleSDF官方演示,一种对视频中的物体进行3D重建

他们提出了一种近乎实时的方法,用于从单目 RGBD 视频序列中对未知物体进行 6-DoF 跟踪,同时对该物体进行神经 3D 重建。我们的方法适用于任意刚性物体,即使在视觉纹理基本不存在的情况下也是如此。假设该物体仅在第一帧中被分割。不需要其他信息,也不对交互代理做出任何假设。我们方法的关键是神经对象场,它与姿势图优化过程同时学习,以便将信息稳健地积累成一致的 3D 表示,同时捕捉几何和外观。自动维护一个动态的姿势记忆帧池,以促进这些线程之间的通信。

2024-06-11 11:01:55 3670 17

原创 conda复现Instruct-NeRF2NeRF

有conda复现Instruct-NeRF2NeRF,大抵是指令编辑场景

2024-05-13 08:58:44 1269 14

原创 javaspring绝对路径和加载类路径的区别

这个就相当于放到了缓存区,只要修改了,就会重启javaspring。对象时,你需要提供一个字符串参数,这个字符串创建是资源在类路径下的路径。是一个用于加载类路径(classpath)下的资源的类。然后在javaspring,读取打印出来,却是覆盖前的文件内容。在写项目的时候,用绝对路径来写入json文件。在Spring框架中,

2024-04-05 23:12:37 288 2

原创 yolov8.1训练自己的数据识别游戏人物的头部。

用yolov8.1来识别游戏人物的头部,使用pytoch-gpu,来训练。labelme图像标注。全网首发yolov8.1conda教程

2024-01-18 22:28:38 1923 8

原创 train: WARNING ⚠️ 0.jpg: ignoring corrupt image/label: could not convert string to float: ‘head‘

根据yaml文件中画标签为0,1,2,3这样的,再通过yaml,转换为str。yolov8,训练时候报错,原因是labelme画标签是使用str类型。

2024-01-18 14:01:50 3303 5

原创 $Bitmap中有标记为已使用的未用簇。簇号:4446 $MFT位图中有标记为已使用的未用文件记录。文件:2143

3,回车,在命令行中输入“chkdsk /f /x c:”,最后的c:替换为需要检查的盘符。用分盘工具的时候分来分去的很开心,然后分一下然后把文件移过去。2,解决方法:使用cmd命令chkdsk。在开始菜单-运行中输入cmd。1,第一步检测提示"$Bitmap 有标记已使用的未用簇"。在网上搜的怎么都看不懂,终于找到一篇试试。然后就可以继续分区啦。

2024-01-14 00:40:28 18538 12

原创 w11 conda 虚拟环境cuda+cudnn+tensorflow-gpu(在conda里下cuda和cudnn)

用conda下载cuda和cudnn,可以不用改本地cuda

2024-01-14 00:25:40 1462 2

原创 coco128数据集下载连接

https://ultralytics.com/assets/coco128.zip

2024-01-08 11:53:45 3145

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除