AI 嗯啦-优快云博客

原创如何通过yolo做一个基于YOLOv8的智能交通监控系统（从零开始讲解如何操作完成模型的训练）

通过上述步骤，你可以从零开始完成基于YOLOv8的智能交通监控系统训练和部署。这个过程包括：数据收集与标注使用YOLOv8进行训练使用训练好的模型进行实时车辆检测加入车辆轨迹跟踪、速度计算、超速告警等功能最终实现检测结果的可视化。调整参数、模型优化和后期评估是提高模型精度和性能的重要环节。

2025-12-23 20:07:00 896 1

原创 Flask 框架基础介绍

Flask 蓝图是组织应用代码的一个重要特性，蓝图可以让你将应用的不同部分进行模块化，方便开发和管理。Flask 路由的核心是将 URL 路径与视图函数进行绑定，用户请求的 URL 会被映射到指定的 Python 函数，称为视图函数。安装后，可以在 Python 脚本中导入 Flask 模块，开始使用 Flask 创建 Web 应用。会启动 Flask 的内置开发服务器，默认在本地的 5000 端口运行。你可以通过浏览器访问。蓝图的使用可以有效地将应用分成多个模块，特别适合于较大的 Web 应用。

2025-12-04 16:40:13 675

原创 langchain_agent智能体

在 AI 领域，Agent（智能体）简单说就是能自主理解任务、规划步骤、调用工具并完成目标的智能系统，核心是 “自己能做决策并行动”，而非被动等待指令。它和普通 AI（比如单纯的聊天机器人）最大的区别在于：普通 AI 只能根据输入直接输出答案，而 Agent 能像人一样 “思考”—— 比如判断 “这个任务需要查实时数据”，然后自己调用搜索引擎，拿到数据后再决定 “要不要整理成表格”，最终一步步完成复杂目标。openai_api_key="你的api",

2025-11-11 11:37:31 772

原创 PyQt5详细入门级介绍（新手看过来）

PyQt5 允许开发者自定义控件，通常通过继承。

2025-10-28 22:08:28 990

原创如何用PyQt5实现一个简易计算器应用

在现代应用开发中，图形用户界面（GUI）是提升用户体验的重要部分。Python作为一门易学且功能强大的编程语言，拥有丰富的GUI开发框架，而PyQt5是其中最为流行的一种。通过本项目，我们将创建一个简易计算器，主要功能包括：支持数字输入。支持基本的数学运算（加法、减法、乘法、除法）。支持计算sin和cos值（基于角度）。支持结果的显示和错误处理。本计算器的UI设计将使用PyQt5的设计器工具来创建，而业务逻辑将由Python脚本处理。

2025-10-28 22:05:17 719

原创 LangChain 框架基础详解：从入门到实战

本文将从框架起源、核心理念、架构组成、关键组件、典型用例、实战流程、与其他工具对比、项目落地建议、总结与展望等多个维度，对 LangChain 进行系统、深入的介绍。旨在帮助人工智能算法工程师、开发者快速掌握 LangChain 的基础知识，并能在实际项目中高效应用。目录摘要1. 框架背景与起源2. 为什么需要 LangChain？价值何在3. LangChain 的核心架构与模块模块化与可扩展性的体现4. LangChain 的关键组件详解4.1 LLM（Large Language Model）接口。

2025-10-27 15:14:09 792

原创关于yolov5 v2.0本地运行出现的一些问题的解决

这个错误是由于尝试将一个在CUDA设备上的张量直接转换为NumPy数组引起的。你需要首先将张量从CUDA设备移动到CPU，然后再进行转换。为了修复这个错误，你需要确保所有相关的张量都在同一个设备上。列表中的某个元素是张量，将其转换为 NumPy 数组。封装到一个列表中（如果它是单个 NumPy 数组），以便统一处理。解决方法就是将yaml文件中的注释都去掉，然后再运行就可以了。是否是一个张量，如果是，将其转换为 NumPy 数组。列表中的每个元素，并确保它们是 NumPy 数组。），但文件包含了非法的多。

2025-10-21 22:07:07 943

原创深度学习——RNN（循环神经网络）原理与应用全解析

RNN是深度学习中的重要工具，它能够有效处理时序数据和序列任务。通过LSTM和GRU等变种，RNN克服了传统RNN的局限，广泛应用于自然语言处理、时间序列预测、语音识别等领域。尽管新型架构如Transformer逐渐崛起，RNN依然是序列任务中的经典模型，值得深入学习和掌握。

2025-10-21 09:17:30 1355

原创 Debug大作战：奇葩报错诊疗所——从崩溃到顿悟的奇幻旅程

每一个奇葩报错背后，都是你与计算机深层沟通的契机。当你能看懂堆栈信息，理解内存泄漏、线程阻塞、I/O阻塞的原理——你就不再是“写代码的人”，而是能与机器对话的“调律师”。Debug不是修Bug，Debug是修心。就像医生面对患者，报错只是症状，真正的问题藏在更深的层次里。奇葩报错，是成长的经验包，是开发者走向成熟的必经之路。

2025-10-20 10:07:48 805

原创深度学习——Python 爬虫原理与实战：从入门到项目实践

网络爬虫是一种自动访问网页并提取数据的程序。本质上，它模拟了人类打开浏览器、点击网页、复制内容的行为，只不过速度更快、规模更大。发送请求（Request）：程序向目标网站服务器发送HTTP请求。获取响应（Response）：服务器返回网页内容（HTML、JSON、XML等）。解析数据（Parse）：使用正则表达式、XPath、BeautifulSoup等工具提取所需内容。存储数据（Save）：将数据保存为CSV、数据库或JSON文件。例如，访问。

2025-10-20 09:47:57 1962

原创深度学习——基于ResNet18迁移学习的图像分类模型

通过继承该类通过.txt文件读取样本路径与类别标签，实现灵活的数据管理。本文完整展示了一个基于ResNet18 迁移学习的20类图像分类任务，从模型加载、参数冻结、数据增强、训练与验证流程，到优化器与学习率调度的全流程实现。通过冻结特征提取层、仅微调分类层的设计，我们能够以极低的训练成本获得高准确率模型，体现了迁移学习在现实任务中的高效性与实用价值。

2025-10-19 19:53:49 1047

原创深度学习——YOLO原理与各版本演化

YOLO（You Only Look Once）是一种基于深度学习的目标检测算法，它的最大特点是将目标检测任务转化为回归问题。YOLO的核心思想是将图像分成一个网格，并在每个网格内预测多个边界框（bounding box）及其对应的类别。与传统的目标检测方法（如R-CNN系列）不同，YOLO采用一个统一的神经网络模型，在单次前向传播中完成所有的检测任务，具有极高的实时性。YOLO的快速检测能力，使得它在视频流和实时目标检测中得到了广泛应用。下面将详细介绍YOLO的演化过程及其各版本的创新。

2025-10-19 19:35:40 1171

原创 yolov3代码详解

我们先创建一个列表，然后进行循环，循环的时候创建一个sequential，再往这个里面添加卷积层，池化层，和激活函数，或者yolo层，再或者残差层再把这个sequential添加到这个列表中去。前面我们对每一层都变成了一个字典，然后现在我们只要对列表中的字典进行读取，然后看其中的module_def["type"]是什么，然后进行搭建网络。这个里面保存的就是我们的模型，只是之前我们写的模型是直接搭建的，然后现在我们的模型先写出来，然后后面再操纵进行搭建。opt.model_def就是我们的模型文件。

2025-10-17 14:17:41 656

原创 YOLO 系列目标检测算法入门：从 YOLO v1 开始理解 One-Stage 检测器

将目标检测问题转化为一个回归问题，通过单次前向传播即可完成对图像中所有目标的定位与分类。任务是否加权权重原因定位（x, y, w, h）是定位不准影响大无目标置信度是负样本过多有目标置信度 & 分类否1.0正样本已稀疏这种设计体现了 YOLO v1 在样本不平衡和多任务冲突下的工程智慧。

2025-10-17 09:10:56 709

原创 LSTM自然语言处理情感分析项目(四)整合调用各类与方法形成主程序

环境准备：配置计算设备，设置随机种子确保可复现性数据处理：加载并分割数据集，构建词汇表，将数据转换为模型可处理的批次格式模型准备：加载预训练词向量，初始化 TextRNN 模型模型训练：使用训练集训练模型，通过验证集监控性能并保存最佳模型模型应用：使用训练好的模型对新文本进行情感预测这种端到端的系统设计使得从数据到预测结果的整个流程清晰可控，便于调试和优化。

2025-10-16 21:53:45 821

原创 Yolo v3

在COCO数据集这9个先验框是：(10x13)，(16x30)，(33x23)，(30x61)，(62x45)，(59x119)，(116x90)，(156x198)，(373x326)。分配上，在最小的13*13特征图上（有最大的感受野）应用较大的先验框(116x90)，(156x198)，(373x326)，适合检测较大的对象。较大的52*52特征图上（较小的感受野）应用较小的先验框(10x13)，(16x30)，(33x23)，适合检测较小的对象。然而，Softmax函数的是每个样本只属于一个类别。

2025-10-16 21:51:46 1003

原创本地部署大模型的完整教程

本文介绍了如何在本地部署一个深度学习图像分类模型。通过Flask框架，我们能够轻松地构建一个HTTP接口，允许用户上传图像并获取模型的预测结果。这一过程涉及模型的加载、图像的预处理以及Flask应用的构建。在实际部署过程中，还需要考虑模型的优化、接口的安全性及性能等因素。希望这篇博客能帮助你在本地成功部署自己的大模型，提升你的AI项目开发效率。如果你有任何问题，欢迎在评论区留言。

2025-10-10 10:06:01 677

原创循环神经网络（RNN）中文情感分类项目详解（附完整代码解析）

TextRNN.py模块功能数据预处理与划分TextRNN.pyLSTM 模型定义训练与验证逻辑main.py程序入口，整合运行使用预训练词向量（如腾讯词向量）；双向 LSTM 捕捉上下文语义；模型提前停止机制；自动保存验证集最优模型；模块化清晰，易于复用。通过本项目，你能完整理解一个RNN（LSTM）文本情感分类系统的构建流程，从数据预处理到模型保存，全程使用 PyTorch 实现。🧩 建议扩展方向：尝试 GRU、Transformer 替换 LSTM；添加 Attention 机制；

2025-10-09 10:53:17 725

原创用 Dlib 实现疲劳检测系统 —— 从原理到完整代码

通过本文，你学会了如何利用 Dlib + OpenCV 实现一个完整的疲劳检测系统。该方法的优势在于：不依赖复杂的深度学习框架；实时性好；模型轻量，易部署；能快速适配不同场景。它为驾驶安全、教育管理、健康监测提供了强有力的技术支撑。如果配合头部姿态识别、嘴部张合检测、打哈欠识别等多模态信号，还能实现更智能的行为分析系统。

2025-10-08 18:02:26 1058

原创使用Dlib库实现人脸识别，比opencv更加好用

Dlib 在人脸关键点检测和特征分析上表现突出，适合精细化任务（如表情、疲劳检测）；OpenCV 则擅长图像处理和硬件交互，常作为 Dlib 的 “辅助工具”（如摄像头操作、图像显示）。两者结合可实现强大的计算机视觉应用。

2025-09-27 21:07:16 663 1

原创使用opencv实现人脸识别

LBPH(Local Binary Patterns Histogram，局部二值模式直方图)算法使用的模型基于LBP(Local Binary Pattern，局部二值模式)算法。LBP 算法最早是被作为一种有效的纹理描述算提出的，因在表述图像局部纹理特征方面效果出众而得到广泛应用。Eigenfaces是在人脸识别的计算机视觉问题中使用的一组特征向量的名称，Eigenfaces是基于PCA（主成分分析）算法实现的。pca。

2025-09-24 20:12:01 1108

原创详细介绍ollama和open-webui的使用（带你一步步动手做）

ollama和open-webui的使用

2025-09-24 20:07:04 917

原创循环神经网络RNN与LSTM网络

之前我们学习了卷积神经网络（CNN），而传统神经网络无法训练出具有顺序的数据且模型搭建时没有考虑数据上下之间的关系。所以我们提出了循环神经网络。。循环神经网络（Recurrent Neural Network,RNN）是一种用于处理序列数据的神经网络架构。与传统神经网络（Feedforward Neural Network, FNN）不同，RNN能够在处理序列输入时具有记忆性，可以保留之前输入的信息并继续作为后续输入的一部分进行计算。序列数据。

2025-09-24 19:59:17 1165

原创 Opencv中的视频背景建模和光流估计

光流估计。

2025-09-17 20:19:03 915

原创 OpenCV目录中data文件夹中的XML文件详细介绍

1、：用于检测图像中的人脸。2、：用于检测图像中的眼睛。3、：用于检测笑容。4、：用于检测图像中的上半身部分，包括头和肩膀。5、：用于检测整个身体。6、：也用于检测人脸，采用了不同的级联分类器（Local Binary Pattern）。7、：用于检测带眼镜的眼睛。8、：用于检测猫的脸部。9、：用于识别猫的面部特征，包括猫的眼睛、鼻子和嘴巴等。10、：用于检测图像中的人脸。11、：用于检测图像中的人脸。12、：用于识别人的面部特征，包括人的眼睛、鼻子和嘴巴等。13、

2025-09-17 20:16:20 841

原创计算机视觉----opencv实战----指纹识别的案例

读取待识别图像 (src.bmp) 和数据库中的所有模板图像对每对图像使用 SIFT 算法提取特征点并进行匹配统计匹配点数量，找到匹配度最高的模板根据模板的 ID 查找对应的姓名并输出可视化显示最佳匹配的特征点对应关系。

2025-09-13 22:29:52 3575 4

原创计算机视觉----opencv高级操作（二）（图像的直方图均衡化，角点检测，特征提取Sift）

按固定间隔选取像素，生成低分辨率图像。一张 512×512 的图像，经 2 倍上采样后，尺寸变为 1024×1024，但新增像素由插值生成，并非真实细节（需超分辨率算法进一步优化）。，通过 “下采样 + 上采样” 的差值计算，存储图像的 “细节信息”，与存储 “低频轮廓” 的高斯金字塔配合使用。的过程，通过减少图像像素数量，缩小图像尺寸，核心目的是减少计算量、节省存储，或为多尺度分析提供低分辨率图像。的过程，通过增加像素数量，放大图像尺寸，核心用于恢复低分辨率图像的细节，或配合下采样实现多尺度操作。

2025-09-12 14:14:41 339

原创计算机视觉----图像投影(透视)变换（小案例）

原理：用 Douglas-Peucker 算法，通过设定精度（周长的 5%）来简化轮廓。关键：使用之前记录的缩放比例，将缩小图像的坐标还原为原始图像坐标。关键：记录缩放比例（原始高度 / 500），用于后续坐标还原。：根据原始顶点坐标计算票据的实际宽高（用勾股定理算边长）：票据通常是图像中面积最大的物体，因此取面积最大的轮廓。：将图像按比例缩小到高度 500 像素（通过。：将矫正后的图像转为黑白二值图，突出文字信息。目标：得到 4 个顶点（票据的四个角）），将图像转为黑白对比明显的二值图。

2025-09-11 20:23:05 1686 3

原创计算机视觉----opencv高级操作（上采样，下采样，拉普拉斯金字塔，图像数值的统计）

最常用的是 “隔行隔列采样”（如 2 倍下采样时，保留图像中坐标为 (2i,2j) 的像素，i、j 为整数）。，通过 “下采样 + 上采样” 的差值计算，存储图像的 “细节信息”，与存储 “低频轮廓” 的高斯金字塔配合使用。一张 1024×1024 的图像，经 2 倍下采样后，尺寸变为 512×512，像素数量减少为原来的 1/4。的过程，通过增加像素数量，放大图像尺寸，核心用于恢复低分辨率图像的细节，或配合下采样实现多尺度操作。：上面的直方图显示了每个像素值的像素数，即从0到255。

2025-09-11 09:29:57 1261

原创计算机视觉--opencv---如何识别不同方向图片的识别

，可以是单通道（灰度图）、三通道（彩色图）或四通道（带 alpha 通道的图像）这里介绍的是固定角度旋转，非特定角度需要详解数学原理，后面再介绍。：旋转后的图像，与输入图像具有相同的数据类型和通道数。：输入图像，必须是 numpy 数组格式（需要实现在大图片中识别不同角度的小图片。

2025-09-09 11:44:31 1105

原创计算机视觉----opencv----身份证号码识别案例

身份证号码识别是计算机视觉领域中证件信息提取的典型应用，广泛用于身份验证、信息录入自动化等场景。本案例基于 Python 的 OpenCV 库实现身份证号码的定位与识别，主要流程包括图像预处理、号码区域定位、字符分割和字符识别四个核心步骤。import cv2# 绘图展示函数cv2.imshow(name, image) # 显示图像，第一个参数是窗口名称，第二个是图像数据cv2.waitKey(0) # 等待用户按键，0表示无限等待cv2是 OpenCV 库的 Python 接口，用于图像处理。

2025-09-09 10:19:24 1197

原创计算机视觉opencv----银行卡号码识别

信用卡类型映射表（根据卡号首位判断）# 图像显示函数cv2.waitKey(0) # 等待按键输入后关闭窗口，便于分步查看处理效果信用卡类型判断：国际通用的信用卡号编码规则中，首位数字代表卡组织（如 4 开头是 Visa 卡），通过映射表可快速识别卡类型。显示函数：封装了 OpenCV 的图像显示功能，方便在开发过程中查看每一步的处理结果，用于调试和验证。

2025-09-08 22:25:33 1207

原创计算机的排序方法

排序是计算机科学中最基础且核心的操作之一，其目的是将一组无序数据按照特定规则（如升序、降序）重新排列。不同排序算法在和适用场景上差异显著，选择合适的排序方法是优化程序性能的关键。以下将详细介绍计算机常用的 10 种排序方法，从基本原理到特性对比进行全面解析。

2025-09-07 22:17:04 1807

原创数据结构深度解析：二叉树的基本原理

二叉树（Binary Tree）是由有限个节点组成的集合，满足以下规则：集合为空时，称为 “空二叉树”；集合非空时，存在一个唯一的 “根节点”（Root）；根节点的左右两侧分别衍生出两个互不相交的子树，称为 “左子树”（Left Subtree）和 “右子树”（Right Subtree）；左子树和右子树也必须是二叉树（即每个节点最多只能有两个子节点，分别称为 “左孩子” 和 “右孩子”）。关键约束。

2025-09-07 21:32:49 1352

原创深度学习--自然语言预处理--- Word2Vec

数据准备：构建词汇表、将文本转为索引序列；初始化参数：输入词向量矩阵W和输出词向量矩阵W'；负采样：为每个正样本采样负样本；前向传播：计算正 / 负样本的预测概率；反向传播：用梯度下降更新W和W'；训练迭代：重复前向 / 反向传播，最小化损失。语料选择：领域相关的语料（如医疗文本）训练的向量，在该领域任务上表现更好；参数调优向量维度：文本语义越复杂（如新闻），维度越高（200-300）；简单场景（如商品标题）可设为 50-100；窗口大小window。

2025-09-06 23:49:22 1431 1

原创深度学习----基于 ResNet-18 的迁移学习详解（教你如何使用别人训练好的模型来优化你自己的训练过程）

迁移学习的核心是 “站在预训练模型的肩膀上，降低任务成本、提升性能”。添加全连接层是迁移学习的 “基础工程”—— 没有它，预训练模型的通用特征无法映射到目标类别，任务无法落地；冻结 backbone 仅训分类头是 “快速验证工具”—— 以最低成本判断预训练特征是否适用，是小数据场景的首选；微调特定层是 “性能优化手段”—— 在数据充足时，通过优化深层特征的适配性，突破 baseline 性能瓶颈。

2025-09-05 22:04:47 1053

原创深度学习----ResNet（残差网络）-彻底改变深度神经网络的训练方式

是在 2015年由微软实验室中的何凯明等几位大神提出，斩获当年ImageNet竞赛中分类任务第一名，目标检测第一名。获得COCO数据集中目标检测第一名，图像分割第一名。这个网络没有改变卷积神经网络的算法原理，只是在逻辑上对网络结构做出修改，但效果极好以至于残差学习的思想被引入到自然语言处理任务中，如文本分类和机器翻译，提升了模型的训练效率和性能。

2025-09-05 20:29:33 950

原创深度学习-----修改学习率来优化模型的几个方法

通过自定义函数灵活控制学习率变化，满足特殊场景需求。lambda简单任务（如线性回归）可选择StepLR或。复杂模型（如 ResNet）推荐或。探索性训练可尝试CyclicLR，大规模模型建议搭配LinearLR预热。

2025-09-04 21:24:52 1394

原创深度学习------模型的保存和使用

在 Python 中，模型的保存与加载是连接模型训练与实际应用的桥梁。合理的保存方式不仅能复用已训练的模型，还能节省重复训练的时间成本。

2025-09-03 22:19:30 1359

原创深度学习----卷积神经网络的数据增强

数据增强是 CNN 训练中 “低成本、高收益” 的关键技术，其核心逻辑是通过模拟数据的自然变异扩充样本多样性，从而提升模型泛化能力。优先选择在线增强，利用随机性提升样本多样性；根据任务场景定制增强方式（如分类用 MixUp，分割需同步变换标签）；控制增强强度，避免语义失真；仅在训练集应用增强，测试集保持原始分布以准确评估模型。随着深度学习的发展，数据增强技术也在不断演进（如结合大模型的语义增强、基于扩散模型的生成式增强），但其核心目标始终是 “让模型学习更鲁棒的特征”。

2025-09-03 19:26:12 1113