- 博客(125)
- 收藏
- 关注
原创 《YOLO 目标检测》—— YOLO v4 详细介绍
Mosaic数据增强:采用了CutMix的方法,将4张图片进行随机缩放、随机裁剪、随机排布的方式进行拼接,增强了对正常背景之外的对象的检测,丰富了检测物体的背景信息。同时,减少了估计均值和方差时的计算量,降低了训练成本。
2024-11-24 23:36:22
2201
1
原创 Python爬虫实战案例(爬取图片)
这里选取了一个4K高清的壁纸网站(彼岸壁纸https://pic.netbian.com)进行爬取。爬取图片与爬取文本内容相似,只是需要加上图片的url,并且在查找图片位置的时候需要带上图片的属性。
2024-11-24 23:35:34
1019
原创 bert 框架
BERT框架起源于2018年,由Google AI Language的研究人员开发。它是自然语言处理领域的一个重大突破,在多项NLP任务中取得了显著的性能提升,如问答、文本分类、命名实体识别等。BERT的成功主要归因于其基于上下文的嵌入模型,这与传统的无上下文嵌入模型形成了鲜明对比。
2024-11-06 21:08:58
1102
原创 PyCharm中 argparse 库 的使用方法
argparse 是 Python 标准库中的一个模块,用于编写用户友好的命令行接口。它使得编写命令行程序变得简单且直观。在 PyCharm 中使用 argparse 库与在其他 IDE 或文本编辑器中使用它的方式相同。
2024-11-04 21:45:58
726
原创 《YOLO 目标检测》—— YOLO v4 详细介绍
YOLO v4(You Only Look Once version 4)是一种先进的目标检测系统,于2020年推出,是对之前版本YOLO的改进。YOLOv4基于深度卷积神经网络,能够高精度实时检测图像中的目标。
2024-11-01 22:41:51
1756
原创 深度学习中的迁移学习
深度学习中的迁移学习是一种重要的机器学习方法,其核心思想在于利用从一个任务(源任务)中学到的知识或模型,来帮助解决另一个相关但不同的任务(目标任务)。
2024-10-31 20:53:28
942
原创 pycharm解析json文件报错:‘gb2312‘ codec can‘t decode byte 0xe6 in position 439: illegal multibyte sequence
处理编码问题时,重要的是要确定数据的正确编码,并相应地调整你的解码策略
2024-10-30 23:01:58
304
原创 pycharm 中 json 库的常用操作
在 PyCharm 中,处理 JSON 数据通常使用 Python 标准库中的 `json` 模块。这个模块提供了一些方便的方法来编码(序列化)和解码(反序列化)JSON 数据
2024-10-29 21:31:35
1345
原创 《YOLO 目标检测》—— YOLO v3详细介绍
YOLO v3(You Only Look Once version 3)是一种快速且准确的目标检测算法,与YOLO v1 和 YOLO v2 相比,在保持高速度的同时,显著提升了检测的精度,特别是在小物体检测方面表现出色。
2024-10-27 22:08:42
1643
原创 《YOLO目标检测》—— YOLO v2 详细介绍
是YOLO(You Only Look Once)系列算法中的一个重要版本,由Joseph Redmon等人在2016年提出。该算法在目标检测领域取得了显著的成就,以其高效、准确的特点受到了广泛关注。
2024-10-23 17:30:08
1364
原创 《YOLO目标检测》—— YOLOv1 详细介绍
YOLO v1的损失函数通过ground truth(真实值)和输出之间的sum-squared error(平方和误差)进行计算。损失函数的设计目标是让坐标(x, y, w, h)、置信度和分类三个方面达到很好的平衡。为了平衡不同部分的损失,YOLO v1对不同的损失赋予了不同的权重。综上所述,YOLO v1是一种快速的目标检测算法,具有端到端的网络结构、全局信息利用和泛化能力强等优点。这些特点使得YOLO v1在实时应用中有一定的优势,但在需要高精度检测的场景中可能表现不佳。
2024-10-22 20:39:44
1159
原创 《YOLO目标检测》—— YOLO的简单介绍及Map评估指标
YOLO(You Only Look Once)是一种目标检测算法,由Redmon等人在2016年提出。它的主要特点是速度快且准确性高,非常适合用于实时目标检测任务。
2024-10-21 21:34:37
1851
原创 《OpenCV计算机视觉》—— 年龄与性别预测
通过使用OpenCV中的cnn模块来调用别人已经训练好的深度学习模型,此篇案例中用到了人脸检测模型、年龄预测模型,性别预测模型
2024-10-18 21:02:39
674
原创 《计算机视觉》—— 基于PyCharm中的dlib库实现人脸关键点定位
人脸关键点定位是指通过计算机视觉技术,识别和定位人脸图像中的关键点,如眼睛、鼻子、嘴巴等特定位置。这些关键点的准确定位对于人脸识别、表情分析、姿态估计等应用具有重要意义。
2024-10-16 20:36:54
1425
1
原创 《OpenCV计算机视觉》—— 用于执行图像透视变换的两个关键函数
cv2.getPerspectiveTransform 和 cv2.warpPerspective 是 OpenCV 库中用于执行透视变换的两个关键函数
2024-10-11 21:53:58
457
原创 《神经网络》—— 长短期记忆网络(Long Short-Term Memory,LSTM)
长短期记忆网络(Long Short-Term Memory,LSTM)是一种特殊的循环神经网络(Recurrent Neural Network, RNN),主要设计用来解决传统RNN在处理长序列数据时存在的梯度消失或梯度爆炸问题。LSTM通过引入门(Gate)机制,使得网络能够记住长期依赖的信息,同时忽略不重要的信息。
2024-10-09 22:58:09
1394
4
原创 《神经网络》—— 循环神经网络RNN(Recurrent Neural Network)
循环神经网络RNN)是一种用于处理序列数据的神经网络架构。与传统的前馈神经网络(Feedforward Neural Network, FNN)不同,传统的前馈神经网络无法训练出具有顺序的数据,在模型搭建时没有考虑数据上下之间的关系RNN 能够在处理当前输入时考虑到之前的输入信息,可以保留之前输入的信息并继续作为后续输入的一部分进行计算,具有记忆性,因此非常适合处理时间序列数据、文本数据等具有序列特性的数据。
2024-10-08 22:52:31
1050
原创 《自然语言处理NLP》—— 独热编码(One-Hot Encoding)
独热编码将每个分类变量转换为一个二进制向量,其中只有一个位置上的值为1,其余位置上的值为0。这种编码方式将每个类别映射为一个固定长度的二进制向量,从而实现了对分类数据的数值化表示。
2024-10-07 23:21:25
923
原创 《自然语言处理NLP》—— 词嵌入(Word Embedding)及 Word2Vec 词嵌入方法
词嵌入(Word Embedding)是自然语言处理(NLP)中的一个核心技术,它能够将词汇表中的单词或短语转换为连续的实数向量
2024-10-07 23:14:51
1571
原创 《OpenCV 计算机视觉》—— 视频背景建模
视频背景建模的主要目的是从视频序列中提取出静态背景,以便将动态的前景对象与静态的背景进行分离。这有助于进一步分析和处理视频内容,如进行运动检测、场景理解和事件检测等。
2024-09-30 19:51:52
1869
1
原创 《迁移学习》—— 将 ResNet18 模型迁移到食物分类项目中
迁移学习是指利用已经训练好的模型,在新的任务上进行微调。迁移学习可以加快模型训练速度,提高模型性能,并且在数据稀缺的情况下也能很好地工作。
2024-09-28 22:31:07
1840
原创 《深度学习》—— ResNet 残差神经网络
ResNet 网络是在 2015年 由微软实验室中的何凯明等几位大神提出,斩获当年ImageNet竞赛中分类任务第一名,目标检测第一名。获得COCO数据集中目标检测第一名,图像分割第一名。
2024-09-26 22:39:52
1963
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人