Kai HVZ-优快云博客

原创《大模型部署》——ollama下载及deepseek本地部署（详细快速部署）

输入ollama serve打开ollama，正常下载完成后ollama会自动开启。直接跳过这一步也可以。Ollama 是一款开源跨平台的大语言模型（LLM）运行工具，旨在简化本地部署和管理 AI 模型的流程。选择想要部署的大模型的大小，这里我选择1.5b，因为我的电脑配置没有很高，如果电脑配置很高可以自行选择。安装模型：复制上方图片中的内容，win+r输入cmd打开控制面板。安装完成后再输入一遍上方图片的内容就可以使用。选择想要部署的模型，这里部署deepseek-r1。下载完成后直接进行安装。

2025-03-31 20:50:35 247

原创《深度学习》——bert框架

BERT（Bidirectional Encoder Representations from Transformers）是由 Google 在 2018 年提出的预训练语言模型框架，其核心思想是通过双向 Transformer 编码器学习深层语言表征，在自然语言处理（NLP）领域具有里程碑意义。

2025-03-31 13:21:49 711

原创《深度学习》——YOLOv5详解

YOLOv5 是一种目标检测算法，属于 YOLO（You Only Look Once）系列的第5代版本。YOLOv5 是一个广泛使用的目标检测算法，它基于 YOLO（You Only Look Once）系列的思想，具有速度快、精度高的特点。它和YOLOv4的区别是v4是属于学术上的，而v5增加了工程上的使用。它在目标检测领域有着重要地位，结合了许多先进的技术，在速度和精度上取得了较好的平衡。主要特点。

2025-03-30 22:40:55 583

原创《深度学习》——yolov4详解

YOLOv4 是一种目标检测算法，属于 YOLO（You Only Look Once）系列的第四代版本。它在目标检测领域有着重要地位，结合了许多先进的技术，在速度和精度上取得了较好的平衡。主要特点高效的检测速度：和传统的目标检测算法相比，YOLOv4 速度极快，能够实时处理视频流，这让它可以在对实时性要求较高的场景中使用，比如自动驾驶、视频监控等。高检测精度：它通过采用一系列先进的技术和改进的网络结构，在目标检测精度上有了显著提升，能够较为准确地识别出图像或视频中的不同目标。

2025-03-30 10:30:55 801

原创《深度学习》——YOLOv3详解

YOLOv3（You Only Look Once, version 3）是一种先进的实时目标检测算法，由 Joseph Redmon 和 Ali Farhadi 开发。它在目标检测领域表现出色，具有速度快、精度较高的特点。

2025-03-21 21:01:34 505

原创《深度学习》——YOLOv2详解

YOLOv2（You Only Look Once, version 2）是一种用于目标检测的深度学习模型，由 Joseph Redmon 等人在 2016 年提出。它是 YOLO 系列的第二代模型，在第一代 YOLO 的基础上进行了多方面的改进，显著提升了检测精度和速度。

2025-03-20 23:18:20 613

原创错误：ImportError: DLL load failed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败。

这个错误 ImportError: DLL load failed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败表明在导入 onnxruntime 库时，Python 无法加载必要的动态链接库（DLL）文件。ImportError: DLL load failed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败。降低版本，使用1.14.1版本。

2025-03-20 20:20:10 609 2

原创《深度学习》—— YOLOv1

YOLOv1（You Only Look Once version 1）是一种用于目标检测的开创性实时算法，由 Joseph Redmon 等人在 2016 年提出。它将目标检测任务视为一个单一的回归问题，直接在图像上预测边界框和类别概率，从而实现了快速的目标检测。

2025-03-19 22:13:53 285

原创《深度学习》—— 模型部署

模型部署是将训练好的机器学习或深度学习模型投入实际生产环境，使其能够处理实时数据并提供预测或推理服务的过程。

2025-03-18 20:29:47 1025

原创《python》—— threading库（线程和多线程）

threading 是 Python 标准库中用于实现多线程编程的模块。多线程编程允许程序同时执行多个任务，提高程序的并发性能，尤其适用于 I/O 密集型任务，例如网络请求、文件读写等。

2025-03-12 20:34:26 918

原创《PaddleOCR》—— 多相机协同工业字符检测与异常报警系统

PaddleOCR 是百度基于飞桨（PaddlePaddle）框架开源的全场景文字识别工具，支持多语言、多场景、高精度的 OCR 能力，覆盖文本检测、识别、方向分类等全流程，广泛应用于文档扫描、车牌识别、票据处理、工业质检等场景。图形化界面设计：主要用于产品包装的编号进行识别确认，当编号对比不正确时，发出警报和闪光，并保存错误图片结果。项目代码：注意：要改成自己的端口号，和摄像头的固定ip地址才可以进行使用。

2025-03-11 20:54:26 846

原创《PaddleOCR》—— OCR

PaddleOCR 是百度基于飞桨（PaddlePaddle）框架开源的全场景文字识别工具，支持多语言、多场景、高精度的 OCR 能力，覆盖文本检测、识别、方向分类等全流程，广泛应用于文档扫描、车牌识别、票据处理、工业质检等场景。

2025-03-11 20:19:04 1100 3

原创《PyQt5》——设计Python GUI（图形用户界面）实例

四个标签：分别用来显示名称和对照表。注意显示对照表的标签大小要和照片的大小相同或者比照片大用来显示照片的全部内容。本实例是设计一个通过玉米和豆粕的价格来预测生猪的价格，并显示预测价格与实际价格波动情况。如图进行设计：清除键用来清除文本内的内容，预测键和打开参照表键来写外部函数。完成后，将qt文件进行保存。开始设计：1、创建一个新的。输入内容和按键进行使用。

2025-03-10 21:44:22 487

原创《 PyQt5》—— 创建 Python GUI（图形用户界面）

PyQt5 是一个用于创建 Python GUI（图形用户界面）应用程序的强大工具包，它是 Qt 应用程序框架的 Python 绑定。Qt 是一个跨平台的 C++ 应用程序开发框架，而 PyQt5 允许开发者使用 Python 语言来调用 Qt 的功能，从而可以方便快捷地开发出具有丰富界面和交互功能的应用程序。左侧的按键拖动进行不同功能的添加键拖动到画布使用。可以通过以下方式进行导入使用：模块以untitked.py为例。程序：为环境中的python执行文件。程序：环境中的执行文件如图。

2025-03-10 21:13:37 314

原创《OpenCV》—— dlib（换脸操作）

dlib 换脸是基于 dlib 库实现的一种人脸替换技术，以下是关于它的详细介绍：原理人脸检测：dlib 库中包含先进的人脸检测器，如基于 HOG（方向梯度直方图）特征和线性分类器的方法，能够在图像或视频帧中快速定位人脸的位置，确定人脸的边界框。关键点检测：利用 dlib 预训练的形状预测模型，如shape_predictor_68_face_landmarks.dat，可以精准定位出人脸的 68 个关键点，这些点分布在眼睛、眉毛、鼻子、嘴巴、下巴等部位，精确描述了人脸的形状和表情。

2025-03-04 19:42:25 2681

原创《OpenCV》—— dlib库（性别年龄预测）

dlib 是一个现代化的 C++ 工具包，包含了机器学习算法和工具，用于创建复杂的软件来解决实际问题。它广泛应用于计算机视觉、机器学习、深度学习、图像处理等领域，同时也提供了 Python 接口，方便 Python 开发者使用。dlib 是一个功能强大、易于使用的工具包，在计算机视觉和机器学习领域有着广泛的应用。通过使用 dlib，开发者可以快速实现各种复杂的任务，如人脸检测、人脸关键点检测等。不过，在某些情况下，直接使用 pip 安装可能会遇到编译问题，因为 dlib 依赖于一些 C++ 编译工具。

2025-03-03 20:36:57 581

原创《OpenCV》——卷积神经网络人脸检测

卷积神经网络基本原理卷积层：通过卷积核在图像上滑动进行卷积操作，提取图像的局部特征，如边缘、纹理等。不同的卷积核可以捕捉不同类型的特征，随着网络层数的增加，卷积层能够从简单的基础特征逐步学习到更复杂、抽象的人脸特征。池化层：主要作用是对特征图进行下采样，降低数据维度，减少计算量，同时还能在一定程度上防止过拟合。常见的池化操作有最大池化和平均池化，通过对特征图的局部区域进行聚合统计，保留重要的特征信息。全连接层。

2025-03-03 20:05:51 820

原创 pytorch2.6.0版本测试YOLOv5中detect.py错误解决办法

错误发生在 attempt_load 函数里调用 torch.load 时，这是因为 PyTorch 2.6 及之后版本中 weights_only 参数默认值改变，导致加载包含不被允许的全局对象。numpy.core.multiarray._reconstruct 的文件失败。当出现如下错误时：File “D:\PythonProject_base\yolov5-v5.0\detect.py”, line 178, in。

2025-03-02 21:34:01 1986 4

原创《OpenCV》——dlib（人脸应用实例）

故此这篇文章只介绍dlib的人脸应用实例。当闭眼时间长时，发出危险警告。

2025-03-02 20:27:29 431 2

原创《OpenCV》—— dlib库

下载所需要的预训练模型，对图片进行人脸关键点定位。读取一张图像，检测其中的人脸，并在每个人脸的 68 个特征点上绘制绿色圆形标记，同时在标记旁边显示特征点的索引编号，最后显示处理后的图像。

2025-03-02 19:23:17 729

原创《OpenCV》—— 人脸识别

人脸识别是一种基于人的面部特征信息进行身份识别的生物识别技术。它通过摄像头等设备采集含有人脸的图像或视频流，然后对图像中的人脸特征进行提取和分析，与预先存储的人脸模板进行比对，从而判断出人脸的身份。分别对三种人脸特征识别器对人脸进行识别。

2025-02-28 15:24:54 470

原创《OpenCV》——人脸检测

本实例对合照图片进行人脸检测，并圈出人脸位置，使用的OpenCV自带的级联分类器可从OpenCV源文件的data目录下，加载不同的级联分类器的XML文件对不同对象的检测。

2025-02-28 14:54:18 853 1

原创《OpenCV》——DNN模块

OpenCV 的 DNN 模块是在 OpenCV 3.3 版本引入的，它旨在为开发者提供一个统一的接口，以便在 OpenCV 框架内加载、部署和运行各种预训练的深度神经网络模型。该模块支持多种深度学习框架训练的模型，无需额外安装复杂的深度学习库，就能在不同平台上实现高效的推理。模型如下：通过网盘分享的文件：model.zip。通过torch训练好的模型进行对图片的处理。文件模型可以自由挑选。

2025-02-27 21:32:39 794

原创《OpenCV》——光流估计

对视频中的人物走动轨迹进行光流追踪处理。实现了基于 Lucas - Kanade 算法的稀疏光流估计，用于处理视频中的运动跟踪。导入numpy库用于数值计算，cv2是 OpenCV 库，用于计算机视觉任务cv2.VideoCapture(‘test.avi’)：打开名为test.avi的视频文件。np.random.randint(0, 255, (100, 3))：生成 100 个随机的 RGB 颜色，用于后续绘制光流轨迹。cap.read()：读取视频的第一帧，ret是一个布尔值，表示是否成功

2025-02-26 19:26:26 1797 2

原创《OpenCV》—— 背景建模

通过背景建模，我们可以实现很多应用，例如运动检测、目标跟踪。

2025-02-25 22:22:40 712

原创《OpenCV》——实例：答题卡识别

检测二值图像中的轮廓，筛选出符合条件（宽度和高度大于等于 20，宽高比在 0.9 到 1.1 之间）的圆圈轮廓，这些圆圈即为答题卡上的选项。对于每组选项，创建一个掩码，将每个选项区域提取出来，计算该区域内的非零像素数量，非零像素数量最多的选项即为被选中的选项。将被选中的选项与答案键进行对比，如果一致则标记为正确，并将正确题目数量加 1。：对四个点进行排序，使其按照左上、右上、右下、左下的顺序排列。遍历轮廓，找到近似为四边形的轮廓，该轮廓即为答题卡的边缘。：进行透视变换，将图像校正为鸟瞰视角，方便后续处理。

2025-02-25 21:39:36 529

原创《计算机视觉OpenCV》——对视频中的文档进行实时检测和处理实例

主要实现了从摄像头实时捕获视频流，检测其中的文档（四边形物体），并对检测到的文档进行透视变换和二值化处理的功能。综合运用了摄像头操作、图像处理、轮廓检测、透视变换和二值化处理等多种计算机视觉和图像处理技术，实现了文档的实时检测和处理。

2025-02-24 23:09:34 448

原创《计算机视觉》——图像拼接

图像拼接的核心原理是基于图像之间的特征匹配。首先，从每幅图像中提取独特的特征点，如角点、边缘点等，这些特征点具有在不同图像中能被准确识别的特点。然后，通过计算特征点之间的相似度，找到不同图像中相匹配的特征点对。一旦确定了匹配点，就可以根据这些点来计算图像之间的变换关系，如平移、旋转、缩放等，从而将图像对齐到同一坐标系中。最后，将对齐后的图像进行融合，消除拼接缝隙，生成一幅无缝的拼接图像。

2025-02-24 20:01:16 1147

原创《深度学习》——RNN网络简单介绍

循环神经网络（Recurrent Neural Network，RNN）是一种专门用于处理序列数据的神经网络，在自然语言处理、语音识别、时间序列预测等领域有广泛应用。RNN 是一种具有循环连接结构的神经网络，允许信息在神经元之间的流动形成环路，从而使网络能够处理序列数据中的长期依赖关系，记住之前的输入信息，在处理当前输入时利用过去的上下文。

2025-02-20 20:02:17 964

原创《深度学习》——自然语言处理（NLP）

自然语言处理（Natural Language Processing，NLP）是计算机科学与语言学等多学科交叉的领域，旨在让计算机理解、处理和生成人类自然语言。在技术发展上，早期以基于规则的方法为主，随着计算机性能提升和数据量增加，基于统计的方法兴起，而深度学习的出现带来了巨大变革，像 Transformer 架构等推动了 NLP 的快速发展。其常见任务丰富多样，包括文本分类（如情感分析、新闻分类）、命名实体识别（提取人名、地名等）、词性标注、句法分析、机器翻译以及文本生成等。

2025-02-19 21:27:39 1178

原创《深度学习》——迁移学习

迁移学习（Transfer Learning）是机器学习中的一个重要概念，旨在将从一个任务（源任务）中学习到的知识应用到另一个相关的任务（目标任务）中，以提高目标任务的学习效率和性能。在传统的机器学习中，模型通常是在特定的数据集上进行训练，并且只能在相似的任务上表现良好。如果遇到新的任务，就需要重新收集和标注大量的数据，并从头开始训练模型。迁移学习的出现，为解决这些问题提供了一种有效的方法。迁移学习的基本思想是：不同任务之间可能存在一些共同的特征或模式，通过学习源任务中的这些共同部分，可以将其迁移到目标

2025-02-18 13:20:24 1223 1

空空如也

空空如也