闻道且行之-优快云博客

原创 NLP 部署实操：Langchain-Chatchat 完整部署教程与踩坑记录

本文围绕 Langchain-Chatchat 的两种主流部署方式展开实操落地，完整呈现 pip 轻量化部署与源码开发部署的全流程，从环境搭建、依赖安装、Ollama 模型配置，到配置文件修改、知识库初始化与项目启动均逐一详解。同时针对部署中遇到的环境依赖冲突、模型配置不匹配、输入长度超限等核心问题，给出了精准的解决方案与优化技巧。

2025-12-24 17:06:52 734

原创数据集|CelebAMask-HQ数据集介绍

在计算机视觉领域，人脸分析是兼具挑战性与广泛应用价值的研究方向，涵盖检测、识别、编辑、虚拟试装、美妆仿真等诸多场景。人脸语义分割作为其核心任务，需对皮肤、眼睛、眉毛等人脸部位实现像素级精准划分，直接决定后续高层视觉任务的性能上限。而CelebAMask-HQ正是支撑该任务算法研发与性能验证的关键基准数据集。官网下载：CelebAMask_HQ接下来会跳转到github中，如下图所示，选择一种下载方式即可。前者是谷歌网盘，后者是百度网盘，没有科学上网的首选百度网盘。如图所示，数据集结构是这样的：

2025-12-24 10:15:35 595

原创 KickPi RK3568平台SPI内核驱动开发

以前文章中有分享怎么在用户层通过spidev进行spi通信，用户层通过 spidev 进行 SPI 通信，其优势在于开发极其便捷，无需编写内核模块即可快速验证硬件，堪称原型开发的利器；然而，其代价是性能与实时性较差，因每次通信都涉及用户态与内核态的切换开销，且难以保证精确时序。相比之下，内核层驱动开发复杂，但能提供极高的性能和稳定性，它直接在内核空间操作，无模式切换损耗，可配合DMA保证时序，并能将设备深度集成到系统框架中。因此，spidev 适用于前期验证和对性能不敏感的场景，而产品化阶段则强烈推荐采

2025-10-25 17:23:50 1060 1

原创 RK3568 KickPi OS 镜像定制：实现屏幕多自适应、GPIO 解禁与用户态 SPI 接口开启

成功解决了KickPi OS在RK3568平台上的两个核心限制：首先，通过有选择地注释默认外设配置（如LED、PWM、UART等），释放了宝贵的GPIO引脚资源，为用户自定义硬件扩展奠定了基础；其次，配置并启用了SPI3控制器，创建了用户态SPI设备节点（/dev/spidev3.0），使得用户能够在应用层直接操作SPI接口，极大简化了外设驱动开发流程。同时，我们建立了稳定可靠的交叉编译环境，解决了Python版本兼容性等常见构建问题。

2025-10-22 18:22:11 912 1

原创 0基础学CV(7)|目标分割之yolov8-seg训练自己的数据集

总的来说，YOLOv8-seg 是工程效率和实用性的胜利者，它以牺牲少量精细度为代价，换来了巨大的速度提升和实例分割能力。而 DeepLabV3 和 U-2-Net 则在各自的专精领域（语义分割、显著性检测）依然保持着精度和细节上的优势。

2025-10-19 12:56:36 900

原创 0基础学CV(6)|目标分割之DeepLabv3训练自己的数据集

通过本项目的完整实践，我们成功构建了标准化的PaddleSeg深度学习环境，建立了从YOLO格式到PaddleSeg标准格式的完整数据转换流水线，并基于DeepLabV3+ResNet50架构在少量数据上实现了快速收敛，仅用2个epoch就达到99%的像素准确率，充分展现了模型优秀的特征学习能力和PaddleSeg框架的易用性。该项目形成的技术方案在医疗影像分析、自动驾驶、工业质检和遥感图像分析等领域具有广泛的应用前景。

2025-10-19 12:55:50 969

原创 0基础学CV(5)|目标检测模型之PaddleDetection训练自己的数据集

PaddleDetection是一个基于PaddlePaddle的目标检测端到端开发套件，在提供丰富的模型组件和测试基准的同时，注重端到端的产业落地应用，通过打造产业级特色模型|工具、建设产业应用范例等手段，帮助开发者实现数据准备、模型选型、模型训练、模型部署的全流程打通，快速进行落地应用。由于本篇文章主要介绍的是目标检测的场景，所以其他的模型就不赘述了，今天的文章是基于PP-PicoDet模型做目标检测任务。

2025-10-15 08:00:00 984

原创总结|C++小技巧

【代码】总结|C++小技巧。

2025-10-07 11:25:40 717

原创 0基础学CV(4)|目标检测模型之yolov8训练自己的数据集

本文将详细介绍使用YOLOv8训练自定义目标检测模型的完整流程。实际上，YOLOv8不仅仅局限于目标检测功能，它还支持其他计算机视觉任务，如实例分割、姿态估计、图像分类等。凭借其高度的灵活性和强大的性能，YOLOv8可以根据不同的应用需求进行定制与扩展。训练方式相同，但数据集需要修改一下。

2025-10-07 08:00:00 995

原创 0基础学CV(3)|分类模型之ResNet训练自己的数据集

分类模型的应用介绍暂时告一段落，因为在目前的任务中，使用MobileNetV2和ResNet这两种模型已经足够满足需求。这两种模型在图像分类任务中表现优秀，尤其是在迁移学习方面，通过预训练的权重，我们可以在较短的时间内实现高效的模型训练并获得较好的性能。后续可能会介绍模型结构或者直接介绍检测模型应用。

2025-09-28 11:57:47 643

原创 0基础学CV(2)|分类模型之MobileNetV2训练自己的数据集

上篇文章介绍了分类、定位和分割任务，以及它们常见的模型。今天我们将进一步探讨分类模型。当前，最常用的分类模型无非是ResNet和MobileNet，这两个模型在计算机视觉领域中得到了广泛应用，并因其优越的性能而成为行业标准。其中MobileNet以轻量化著称，结构简洁且高效。今天就介绍一下如何训练自己的MobileNet。训练环境很简单，这里默认你已经安装了conda，如果没有安装conda的兄弟们，可以看一下我以前的文章：Anaconda 安装保姆级教程(Windows + Linux)，以及换源操

2025-09-27 08:00:00 792

原创嵌入式|Linux下MQTT编译安装

本文介绍了 Paho MQTT C++ 库的完整编译流程，包括依赖安装、Paho C 库与 C++ 库的编译与安装步骤，并针对常见的编译错误提供了解决方法。通过以上过程，可在支持的系统环境中顺利构建 Paho MQTT C++ 开发库。

2025-09-25 16:56:08 870

原创驱动开发(4)|鲁班猫rk356x镜像编译，及启用SPI控制器驱动

在进行驱动开发或内核定制时，若遇到将SPI控制器配置为SLAVE模式失败的情况，通常是由于Linux内核未启用相关功能支持所致。本文详细介绍了两种解决方案：一是通过编译内核deb包实现功能启用，适用于仅需更新内核的场景；二是完整编译系统镜像，适用于需要整体固件更新的情况。

2025-09-24 19:56:54 811

原创 0基础学CV(1)|浅谈一下计算机视觉的三大基本任务

分类任务的目标是将输入的图像或视频中的内容分到一个预定的类别中。每个图像对应一个标签，计算机通过学习图像特征与标签之间的关系，实现对新图像的正确分类。分类任务是计算机视觉中最基础也是最常见的任务之一。如图下所示，分类任务简单来说就是将图片的内容根据预定义的类别进行归类。定位任务的目标是在输入图像中确定一个物体的位置，通常表现为在图像上框出一个矩形框（bounding box），表示物体所在的区域。与分类不同，定位不仅需要判断图像的内容，还要识别物体的精确位置。

2025-09-20 08:00:00 1149

原创模型部署|将自己训练的yolov8模型在rk3568上部署

本文主要记录了如何将自己训练的 .pt 文件模型转换为 RKNN 格式的模型。这个过程涉及从 PyTorch 框架中导出训练好的模型，并通过 RKNN Toolkit 对其进行优化和转化，以便能够在 Rockchip 的硬件平台上进行推理加速。

2025-09-14 20:02:11 1085 2

原创嵌入式|Linux中打开视频流的两种方式V4l2和opencv

在Linux操作系统中，视频流的获取和处理是现代多媒体应用和计算机视觉技术的核心，广泛应用于实时监控、视频分析、机器人视觉和自动驾驶等领域。为了高效地捕捉和处理视频流，Linux提供了多种强大的工具和库，其中V4L2（Video4Linux2）和OpenCV是最常用的两种技术。V4L2为底层硬件提供了标准化的接口，支持多种视频设备，并为开发者提供了强大的功能，但使用上相对复杂，需要较多的配置和操作。

2025-09-05 22:15:00 1256

原创 FPGA|Quartus II 中使用TCL文件进行引脚一键分配

功能：该命令用于将特定的逻辑元素（如FPGA中的输入/输出引脚、存储器块等）分配到特定的物理位置（引脚、块）上。location-toinstance指定要分配的物理位置（例如，具体的引脚编号）。指定要进行位置分配的设计实例或信号。用途：通常用于在FPGA设计中强制特定的模块或引脚占用特定的硬件位置，确保信号的正确路由和时序要求。通过合理的引脚分配，可以减少信号延迟和电路拥塞。功能：该命令用于设置特定实例的属性或约束，可能包括配置信息、实现方式或特定的制造工艺选择。property。

2025-09-01 21:13:02 1294

原创 FPGA|Quartus II 中pll IP核的具体使用方法

PLL（Phase-Locked Loop，锁相环）是 FPGA 中常用的时钟管理工具，能够从输入时钟中生成不同频率的输出时钟。PLL 可以调节频率、改变相位，甚至实现时钟的分频和倍频，广泛应用于时钟信号的同步、去抖动和频率转换等任务。在 Quartus II 中，PLL 是通过使用其提供的 PLL IP 核实现的。PLL IP 核不仅简化了时钟管理的流程，还为用户提供了丰富的配置选项，帮助实现各种复杂的时钟设计需求。

2025-09-01 20:38:26 803

原创 FPGA|AC620固化程序步骤

这里大概介绍一下，各个文件的作用，这里我们要转化的文件为jic。hexout这种格式的文件通常用于FPGA的编程或配置存储器中，包含FPGA的配置数据，通常是Intel Hex格式。它用于编程存储器或在特定平台上加载FPGA配置。通常用于生成通过其他工具烧录到非易失性存储器（如EPROM、闪存）中的数据。.pof文件是一个编程对象文件，通常用于将FPGA配置烧录到非易失性存储器（如闪存）中，以便在设备启动时加载FPGA配置。

2025-09-01 20:37:26 830

原创 LubanCat-RK3568 UART串口通信，以及遇到bug笔记

这个项目的目标是通过RK3568主控芯片与FPGA开发板的配合，实现墨盒打印图像的功能。通过UART通信协议将图像的像素点数据传输给FPGA，再由FPGA控制墨盒完成打印。这一过程涉及多个技术环节，包括数据传输、图像处理和打印控制，后续有时间再去整理fpga代码方面的通用技能。

2025-08-29 20:35:10 769

原创嵌入式|VNC实现开发板远程Debian桌面

VNC（Virtual Network Console）是一种远程桌面协议，允许用户通过网络远程控制另一台计算机的桌面环境。它的工作原理是通过客户端与服务器之间传输图像、键盘输入和鼠标事件来实现远程操作。与传统的远程桌面技术不同，VNC 的特点在于它的平台独立性——用户可以在任何支持 VNC 协议的设备上访问目标计算机的桌面，无论是 Windows、Linux、macOS 还是其他操作系统。

2025-08-13 21:26:21 968

原创 Android Studio下载及安装配置

虽然之前曾接触过 Android Studio，但由于没有持续使用，许多功能和操作逐渐遗忘。在这个过程中，我深刻认识到记录笔记的重要性。通过随手记录，我不仅能帮助自己回忆起细节，还能加深对工具的理解和掌握。当前遇到的问题已经记录下来，后续如果遇到新的挑战，我会及时更新到这篇文章中。毕竟，“好记性不如烂笔头”，而这些笔记将成为我不断提升工作效率和解决问题的宝贵资源。

2025-08-05 20:52:57 398

原创 TTS语音合成|f5-tts语音合成服务器部署，实现http访问

本篇文章主要分享了如何使用F5-TTS实现一个HTTP服务器，并通过该服务器提供文本到语音（TTS）服务。通过搭建这个服务器，用户可以方便地通过API接口进行文本转语音的请求。文章详细介绍了如何配置和运行该服务器，如何处理API请求，并展示了如何利用该服务将文本转换为自然流畅的语音输出。此外，文中还探讨了如何优化服务器的性能，确保高效的文本转语音处理，同时提供了相关的错误处理机制，确保用户体验的稳定性与可靠性。

2025-07-31 18:11:53 1825

原创 TTS语音合成|GPT-SoVITS语音合成服务器部署，实现http访问

这篇文章主要分享了GPT-SoVITS如何实现一个HTTP服务器，并通过该服务器提供文本到语音（TTS）的服务。通过搭建这个服务器，用户可以方便地通过API接口请求文本转语音功能，支持多种配置选项，如不同的音频格式、语言设置以及参考音频路径。该服务器不仅支持常规的语音合成任务，还能够进行模型切换、命令控制等操作，极大地提升了系统的灵活性和可扩展性。通过这种方式，GPT-SoVITS将强大的语音合成能力与现代Web应用相结合，为开发者提供了一个易于集成和使用的解决方案。

2025-07-31 14:23:33 1771 5

原创 Windows|CUDA和cuDNN下载和安装，默认安装在C盘和不安装在C盘的两种方法

在自定义安装时，兄弟们可以选择将 CUDA 和 cuDNN安装到其他盘符（如 D 盘或 E 盘），节省C盘的内存，目前安装时，只发现了这些问题，后续如果再发现其他问题随时补充。

2025-07-27 22:29:17 3107 2

原创 TTS语音合成|盘点两款主流TTS模型，F5-TTS和GPT-SoVITS

在进行微调训练时，两个TTS模型都是基于预训练模型进行直接生成的。根据个人的使用体验，推理速度和音色方面，F5-TTS确实表现得更加出色，生成的语音在流畅度和自然度上有明显的优势。然而，在文字识别和稳定性方面，GPT-SoVITS则展现了更强的能力。例如，当我们测试一个简单的字符串“1-2”时，F5-TTS往往无法正确识别并生成合适的语音，而GPT-SoVITS则能够准确识别出“1-2”对应的中文发音“ 一到二”，展现了其更强的语音理解和转换能力。

2025-07-21 11:28:04 1622

原创 Qt交叉编译Windows编译aarch64程序

虽然交叉编译开发Qt过程中确实踩了很多坑，但细心回顾后发现，很多问题其实都能通过仔细检查和提前准备来避免。技术本身并不复杂，关键在于对每个步骤的把握。只要在配置环境、选择正确的工具链、处理依赖关系等方面做到充分的检查，许多潜在的问题都会迎刃而解。其实，许多难题的解决往往源于对细节的关注和对文档的深入研究，循序渐进的调试与不断优化也能让过程变得更加顺利。

2025-07-15 09:14:34 1293 1

原创 Anaconda 安装保姆级教程(Windows + Linux)，以及换源操作

目前安装没有出现什么明显的bug，之前很多人都问我怎么安装Anaconda，我又不好一一回复，索性就趁空闲时间记录一下，方便兄弟们查看。

2025-07-13 21:44:26 724

原创驱动开发(3)|rk356x驱动GPIO基础应用之点亮led灯

这篇文章主要分享了在RK3568平台上控制GPIO的两种常见方式，并通过LED灯的实验测试，验证了这两种方法的效果。首先介绍了通过编程接口操作GPIO的基本原理和步骤，包括如何设置输入输出模式、读取和写入数据。后续这一系列将暂时停更，主要想先写CV和NLP算法方面的文章。

2025-07-13 18:29:59 554

原创驱动开发(2)|鲁班猫rk3568简单GPIO波形操控

本文主要分享了GPIO控制的四种方式，shell两种控制方式，和使用代码控制的两种方式，重点要说的是如果你追求极致性能和对硬件有较高的控制要求，可能更合适。反之，若追求易用性和代码的可维护性，gpio_set_value 更为推荐。

2025-05-29 19:43:26 1941

原创 Paddle Serving|部署一个自己的OCR识别服务器

本文主要简要记录了PaddleServing项目的部署过程，旨在帮助读者快速了解如何搭建和配置PaddleServing服务。PaddleServing是一个基于PaddlePaddle的高效推理服务框架，能够帮助用户便捷地将训练好的模型部署为可供实时预测的服务。本文将详细介绍部署过程的步骤，包括环境配置、服务启动、模型加载以及API调用等方面的内容。

2025-05-02 17:30:09 2082

原创 windows专业版和家庭版搭建自己的ftp服务器，保姆级教程(用户验证+无验证)

本文主要记录了在windows上如何创建ftp服务器，至于为什么没有防火墙配置，是因为我没有遇到这个问题，可能是因为我用的主机来访问虚拟机，如果之后遇到防火墙问题，后续会再补充上去。

2025-05-01 18:20:39 3577 8

原创驱动开发(1)|鲁班猫rk356x内核编译，及helloworld驱动程序编译

本文主要记录了如何下载内核源码、编译源码的详细步骤，并介绍了如何实现并编译一个简单的 HelloWorld 驱动程序。通过这篇文章，您将能够了解从获取内核源码、配置编译环境，到成功编译并加载内核模块的全过程。特别地，我们将通过一个简单的 HelloWorld 驱动程序实例，展示如何编写、编译和测试一个基本的 Linux 内核模块，从而帮助您更好地掌握内核驱动开发的基本流程。

2025-04-26 11:51:55 1311

原创 frp内网穿透|小白版frp简单内网穿透，无需域名

本文简要介绍了如何使用 FRP 实现内网穿透。由于篇幅限制，无法详细展开所有配置和应用场景，但核心步骤和关键点已涵盖，旨在为读者提供一个清晰的入门指导。如果后续有时间的话，会考虑将nginx和域名加上，做个进阶教程。

2025-04-10 11:19:21 1333

原创部署|Llama-Facory微调模型部署

本文介绍了如何将llama-factory微调后的大模型通过ollama部署，方便自己查看不用每个网页看一点，到处找各种命令。

2025-03-19 09:44:10 789

原创记录| Llama-Factory参数总结

这只是目前阶段，有疑问的超参数和微调问题，后续会继续提出问题、解决问题、总结问题，持续更新。

2025-03-18 11:44:56 1580

原创模型部署| PP-OCRv3在Centos7.9上部署，fastdeploy编译

编译这个项目一波三折，编译项目跟着官网上的步骤基本上不会出错，但是gcc/g++的安装却是一波三折，编译完成打算搞成个ocr识别服务器。

2025-03-12 13:51:32 918 2

原创环境安装(Centos7.9)| gcc8.2安装 + cmake3.30.8安装(解决version `GLIBCXX_3.4.xx‘ not found)

如下图所示，1为gcc8.2的依赖库，2为gcc8.2下载依赖库的下载源。安装之前要先安装低版本的gcc/g++，不然编译会报错没有c的编译器。很多教程到上一步就完成了，导致编译项目的时候会出现。相较于gcc/g++安装，cmake安装简单很多。等问题，原因是没有软链接新的gcc编译器。然后根据下列步骤操作。

2025-03-12 13:39:12 667