- 博客(31)
- 收藏
- 关注
原创 Docker
Docker是一个开源的容器化平台,允许开发者将应用及其所有依赖打包到一个轻量、可移植的容器中。通过容器,应用可以在不同环境中一致运行,避免“环境不一致”导致的问题。镜像 镜像,Image,是一个只读的模板,包含应用运行所需代码、库、依赖、配置文件等。类似于虚拟机的“快照”,更轻量。容器 容器,Container,是镜像的运行实例。容器在隔离的环境中运行应用,但共享宿主机的操作系统内核,启动速度快,占用资源少。Docker引擎 Docker引擎,Docker Engine,是Docker的核心组件,负责镜像
2025-08-26 20:21:03
1329
4
原创 开源大模型本地部署
简历项目框架三个模块大语言模型(LLM)--实现大语言模型的对话功能:大模型的本地部署,微调训练,流式对话,多轮对话。RAG技术--增强大语言模型的对话能力:文本分割,文本嵌入,知识检索知识图谱--实现数据的高效存储:neo4j数据库,三元组抽取,实体对齐项目展示项目流式输出非流式输出返回方式边生成边返回全部生成后一次返回响应速度快慢(尤其是长文本)使用体验更自然(打字式)等待过程较长编程复杂度稍复杂(需拼接)简单适用场景对话生成、直播问答。
2025-08-26 19:36:22
1687
原创 Tokenizer
语言模型,Language Model, LM,是自然语言处理领域的核心组件,其核心任务是建模自然语言的概率分布,即预测一段文本(或序列)出现的可能性。语言模型通过计算概率描述语言序列的合理性:文本生成:生成连贯的文本(如聊天机器人、故事创作)。语音识别:分辨发音相近但概率不同的句子(如“识别成功” vs. “识别成公”)。机器翻译:选择最合理的译句。拼写纠错:修正低概率的输入序列。信息检索:改进搜索结果的排序。N-gram模型基于马尔可夫假设,仅依赖前 n-1 个词:缺点:数据稀疏问题(需平滑技术如拉普拉
2025-08-26 18:52:33
706
原创 Transformer
Self-Attention(SA) Mechanism,自注意力机制,用于捕捉序列数据内部依赖关系的关键技术。它在NLP和CV中非常重要,尤其是Transformer。
2025-08-22 10:51:53
963
原创 循环神经网络
循环神经网络(Recurrent Neural Network,RNN)是一种神经网络结构,专门用于处理序列数据。与传统的前馈神经网络不同,RNN 在内部具有反馈连接,允许信息在网络内部传递。这种结构使得 RNN 能够对序列数据的历史信息进行建模,并在一定程度上具有记忆能力。在自然语言处理领域,RNN 被广泛应用于语言建模、机器翻译、情感分析等任务。通过捕捉单词之间的上下文信息,RNN 能够更好地理解语言的含义和结构。同时,RNN 也在时间序列预测领域发挥着重要作用,比如股票价格预测、天气预测等。
2025-08-12 16:07:24
1100
原创 YOLO---05YOLOv4
YOLOv4 论文地址::【YOLOv4 论文中文翻译地址:【YOLOv4 是一种高效且准确的目标检测模型,它在 YOLOv3 的基础上引入了多项改进,旨在提高模型的检测速度和精度,自诩为Optimal Speed and Accuracy of Object Detection(目标检测的最佳速度和最佳精度)
2025-08-04 19:23:06
817
原创 YOLO---04YOLOv3
YOLOV3 论文地址::【YOLOV3 论文中文翻译地址::【YOLOv3 在实时性和精确性在当时都是做的比较好的,并在工业界得到了广泛应用YOLOv3 改进网络结构,使其更适合小目标检测,改进 softmax,预测多标签任务YOLOv3 最显著的改进就是在 3 个尺度上以相同的方式进行目标的检测,每种 3 个锚框,共 9 个。这使其可以检测到不同规模的目标。
2025-08-01 19:10:39
1220
原创 YOLO--03YOLOv2
YOLOv2 是 Joseph Redmon 和 Ali Farhadi 发表在 CVPR 2017,对原始 YOLOV1 的一些改进YOLOv2 论文地址:【YOLOv2 论文中文对照地址:【
2025-08-01 18:51:43
844
原创 YOLO---02YOLOv1
YOLOv1 的设计灵感来自用于GoogLeNet模型2016年,Joseph Redmon、Santosh Divvala、Ross Girshick 等人提出了一种单阶段的目标检测网络。它的检测速度非常快,以 45 帧/秒的速度实时处理图像。
2025-07-31 18:43:21
585
原创 YOLO---01目标检测基础
YOLOV1-YOLOV4:学习掌握 YOLO 作者的涉及思路和优化方式【理论】YOLOV5 和YOLO11:学习掌握使用 YOLO 开源算法完成模型的训练、应用、优化等【实践】ModelBackboneNeckHeadv1GoogLeNetNonev2Darknet19v3Darknet53FPNv4v5。
2025-07-30 22:29:06
1105
原创 深度学习-全连接神经网络2
梯度下降算法通过不断更新参数来最小化损失函数,是反向传播算法中计算权重调整的基础。在实际应用中,根据数据的规模和计算资源的情况,选择合适的梯度下降方式(批量、随机、小批量)及其变种(如动量法、Adam等)可以显著提高模型训练的效率和效果。Adam是目前最为流行的优化算法之一,因其稳定性和高效性,广泛应用于各种深度学习模型的训练中。Adam结合了动量法和RMSProp的优点,能够在不同情况下自适应调整学习率,并提供快速且稳定的收敛表现。# momentum:动量,根据历史梯度增加惯性。
2025-07-22 19:09:20
998
原创 深度学习-全连接神经网络1
在使用Torch构建网络模型时,每个网络层的参数都有默认的初始化方法,同时还可以通过以上方法来对网络参数进行初始化。当输出层使用softmax多分类时,使用交叉熵损失函数;当输出层使用sigmoid二分类时,使用二分类交叉熵损失函数, 比如在逻辑回归中使用;当功能为线性回归时,使用均方差损失-L2 loss;
2025-07-21 18:57:05
997
原创 深度学习-Torch框架
PyTorch会将数据封装成张量(Tensor)进行计算,所谓张量就是元素为相同类型的多维矩阵。张量可以在 GPU 上加速运行。
2025-07-15 09:23:04
795
原创 机器学习2
我们现在用p1(x,y)表示数据点(x,y)属于类别1(图中红色圆点表示的类别)的概率,用p2(x,y)表示数据点(x,y)属于类别2(图中蓝色三角形表示的类别)的概率,那么对于一个新数据点(x,y),可以用下面的规则来判断它的类别:如果p1(x,y)>p2(x,y),那么类别为1如果p1(x,y)<p2(x,y),那么类别为2也就是说,我们会选择高概率对应的类别。这就是贝叶斯决策理论的核心思想,即选择具有最高概率的决策。已经了解了贝叶斯决策理论的核心思想,那么接下来,就是学习如何计算p1和p2概率。
2025-07-11 19:39:26
984
原创 机器学习1
获取数据、数据处理、特征工程后,就可以交给预估器进行机器学习,使用测试集对模型进行评估# 引入数据集# 引入KNN模型# 引入标准化工具# 引入数据集划分工具# 训练函数# 加载数据iris=load_iris() # 加载鸢尾花数据集x=iris.data # 鸢尾花的特征数据(x)y=iris.target # 鸢尾花的标签数据(y)# 数据集划分# 把训练数据进行数据标准化# 创建knn算法模型# 使用训练集训练模型# 使用测试集数据对模型进行评估。
2025-07-10 16:46:31
1221
原创 OpenCV-图像预处理4
接下来我们就要进行计算,就是将要缩放的范围(通常是缩放到0-255,所以就是255-0)乘以累计比例,得到新的像素值,并将新的像素值放到对应的位置上,比如像素值为50的像素点,将其累计比例乘以255,也就是0.33乘以255得到84.15,取整后得到84,并将84放在原图像中像素值为50的地方,像素值为100、210、255的计算过程类似,最终会得到如下图所示的结果,这样就完成了最基本的直方图均衡化的过程。如果是彩色图像的话,传入的参数可以是 [0],[1],[2] 它们分别对应着通道 B,G,R。
2025-04-28 18:14:31
1080
原创 OpenCV-图像预处理3
假设当前像素点为(x,y),其梯度方向是0°,梯度值为G(x,y),那么我们就需要比较G(x,y)与两个相邻像素的梯度值:G(x-1,y)和G(x+1,y)。蓝色的是最小外接矩形,会考虑面积。将集中的点进行两两配对,并进行连线,对于每条直线,检查其余所有的点是否处于该直线的同一侧,如果是,那么说明构成该直线的两个点就是凸包点,其余的线依次进行计算,从而获取所有的凸包点。以上保暖为例,找到上包中的点距离该直线最远的点P_3,连线并寻找直线P1P3左侧的点和P2P3右侧的点,然后重复本步骤,直到找不到为止。
2025-04-28 12:36:21
864
原创 OpenCV-图像预处理2
最后,将得到的目标物体图像与要添加水印的区域进行相加,就完成了添加水印的操作。这个三维数组的第一个维度(即轴0)通常代表图像的高度,第二个维度(即轴1)代表图像的宽度,而第三个维度(即轴2)代表图像的三个颜色通道(B、G、R,OpenCV读取到的图像以BGR的方式存储)所对应的像素值。前一个实验中,我们已经能够识别到图像中的某一种颜色,那么我们就可以对识别到的颜色进行一个操作,比如将其替换成别的颜色,其原理就是在得到原图的掩膜之后,对掩膜中的白色区域所对应的原图中的区域进行一个像素值的修改即可。
2025-04-27 18:29:41
2435
原创 OpenCV-图像预处理1
而透视变换是把一个图像投影到一个新的视平面的过程,在现实世界中,我们观察到的物体在视觉上会受到透视效果的影响,即远处的物体看起来会比近处的物体小。Lanczos插值方法与双三次插值的思想是一样的,不同的就是其需要的原图像周围的像素点的范围变成了8*8,并且不再使用BiCubic函数来计算权重,而是换了一个公式计算权重。一般对颜色空间的图像进行有效处理都是在HSV空间进行的,然后对于基本色中对应的HSV分量需要给定一个严格的范围,下面是通过实验计算的模糊范围(准确的范围在网上都没有给出)。
2025-04-27 14:16:49
2075
原创 OpenCV-图像基础
OpenCV(开放源代码计算机视觉库)是一个开源的计算机视觉和机器学习软件库。由一系列 C++ 类和函数构成,用于图像处理、计算机视觉领域的算法实现完全开源,可以自由使用,降低开发成本和技术门槛。除C++原生接口外,还支持Java、Python等编程语言。支持多种操作系统,Windows、Linux、ios、Android等,方便开发和部署。完善的传统计算机视觉算法,涵盖主流的机器学习算法,同时添加了对深度学习的支持。OpenCV-Python是原始OpenCV C++实现的Python包装器。
2025-04-13 11:28:00
1004
原创 Pandas库语法
Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来Pandas 名字衍生自术语 "panel data"(面板数据)和 "Python data analysis"(Python 数据分析)Pandas 已经成为 Python 数据分析的必备高级工具,它的目标是成为强大、灵活、可以支持任何编程语言的数据分析工具Pandas 是 Python 语言的一个扩展程序库,用于数据分析。
2025-04-03 13:55:41
862
原创 Matplotlib库语法
Matplotlib 库:是一款用于数据可视化的 Python 软件包,支持跨平台运行,它能够根据 NumPy ndarray 数组来绘制 2D 图像,它使用简单、代码清晰易懂Matplotlib 图形组成:Figure:指整个图形,您可以把它理解成一张画布,它包括了所有的元素,比如标题、轴线等Axes:绘制 2D 图像的实际区域,也称为轴域区,或者绘图区Axis:指坐标系中的垂直轴与水平轴,包含轴的长度大小(图中轴长为 7)、轴标签(指 x 轴,y轴)和刻度标签。
2025-04-01 11:01:35
799
原创 Numpy库语法
NumPy 的全称是“ Numeric Python”,它是 Python 的第三方扩展包,主要用来计算、处理一维或多维数组在数组算术计算方面, NumPy 提供了大量的数学函数NumPy 的底层主要用 C语言编写,因此它能够高速地执行数值计算NumPy 还提供了多种数据结构,这些数据结构能够非常契合的应用在数组和矩阵的运算上。
2025-03-30 16:42:29
2157
原创 Python语法6(迭代器和生成器、异常处理)
自定义迭代器类return self # 迭代器返回自身else:raise StopIteration # 数据迭代结束# 使用自定义迭代器。
2025-03-27 13:27:11
619
原创 Python语法5(面相对象编程)
面向对象编程(Object-Oriented Programming,简称OOP)是一种通过组织对象来设计程序的编程方法。Python天生就是面向对象的模块化编程。
2025-03-27 12:25:59
1146
原创 Python基础语法3(函数)
使用def 语句定义一个函数a# 函数体# 进行一些操作return result # 可选的返回值说明用于声明一个函数,告诉 Python 这是一个函数的定义。函数名,一个有效的标识符,规则和变量名一致。形参,可以是0 ~ n 个,参数之间用逗号分隔。定义函数执行的具体操作。指定函数的返回值,没有则返回None。return之后的代码不会执行。函数声明(定义)后 不会直接运行函数调用(函数名())一次就运行一次。
2025-03-16 20:44:38
1104
原创 学前环境配置准备
Python.exe:是Python解释器的可执行文件,负责运行python代码编辑器:编写.py文件的工具,如VS Code、PyCharm.py文件:包含Python代码的文本文件,通常由编辑器编写虚拟环境:为项目提供独立的Python环境,运行文件时使用的是该环境中的python.exe和依赖的库使用编辑器编写 .py 文件。在虚拟环境中激活 python.exe。通过虚拟环境中的 python.exe 运行 .py 文件。
2025-03-13 08:54:59
1019
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅