
飞桨
文章平均质量分 82
飞桨
oogogogogo
这个作者很懒,什么都没留下…
展开
-
自然语言处理(NLP)
自然语言处理(NLP)主要研究人与计算机之间,使用自然语言进行有效通信的各种理论和方法。自然语言处理的主要技术范畴1、语义文本相似度分析语义文本相似度分析是对两段文本的意义和本质之间的相似度进行分析的过程。2、信息检索信息检索是指将信息按一定的方式加以组织,并通过信息查找满足用户的信息需求的过程和技术。3、 信息抽取信息抽取是指从非结构化/半结构化文本(如网页、新闻、 论文文献、微博等)中提取指定类型的信息(如实体、属性、关系、事件、商品记录等),并通过信息归并、冗余消除原创 2021-12-10 15:41:12 · 16477 阅读 · 0 评论 -
AI识虫数据集
AI识虫数据集该数据集提供了2183张图片,其中训练集1693张,验证集245张,测试集245张。 size:图片尺寸 object:图片中包含的物体,一张图片中包含多个物体 name:昆虫名称 bndbox:物体真实框 difficult:识别是否困难 标注信息读取1、将昆虫名字转化成数字标签2、读取annotations目录下的xml文件3、读取图片和他对应的标注附:cv2.imread和c原创 2021-12-10 15:40:07 · 3752 阅读 · 4 评论 -
YOLO-V3
设计思想主要特点: 单阶段检测,同时完成候选区域生成 + 物体位置和类别的预测 每个真实框只对应一个正的候选区域 实现方案生成锚框和候选区域生成锚框step1:将原图划分成多个小方块区域原图大小:640 × 480小方块尺寸:32 × 32划分成了20 × 15 个小方块区域step2:以小方块区域为中心,生成一系列锚框生成锚框的规则: 中心点:小方块区域的中心 大小:3种 [w,h]原创 2021-12-10 15:38:43 · 1621 阅读 · 0 评论 -
【目标检测基础】
目标检测对计算机而言,能够“看到”的是图像被编码之后的数字,但它很难理解高层语义概念,比如图像或者视频帧中出现的目标是人还是物体,更无法定位目标出现在图像中哪个区域。目标检测的主要目的是让计算机可以自动识别图片或者视频帧中所有目标的类别,并在该目标周围绘制边界框,标示出每个目标的位置分类 VS 检测分类分类问题:所属类别(用卷积网络提取特征,然后用特征预测分类概率)图像分类流程示意图:通过图(a),分类任务:得到最终的分类所属类别可能是动物或是斑马检测原创 2021-12-10 15:37:41 · 2325 阅读 · 0 评论 -
【图像增广】
图像增广使用的数据太少,会造成过拟合使用的数据太多,需要大量收集数据数据增多(图像增广)在计算机视觉中,通常会对图像做一些随机的变化,产生相似但又不完全相同的样本。主要作用扩大训练数据集,抑制过拟合,提升模型的泛化能力。常用方法 随机改变亮暗、对比度和颜色等 随机填充 随机裁剪 随机缩放 随即翻转 随机改变亮度、对比度、颜色随机在图像外围进行填充随机裁剪防止裁剪将目标物体裁没,所以要计算新裁原创 2021-12-10 15:36:34 · 1142 阅读 · 0 评论 -
图像分类、5个网络
图像分类基于卷积神经网络的图像分类方法图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层次视觉任务的基础。按照被提出的时间顺序,涵盖如下卷积神经网络: LeNet:Yan LeCun等人于1998年第一次将卷积神经网络应用到图像分类任务上[1],在手写数字识别任务上取得了巨大成功。 AlexNet:Alex Krizhevsky等人在2012年提出了AlexNet[2], 并应用在大原创 2021-12-10 15:34:41 · 5272 阅读 · 0 评论 -
卷积神经网络
深度学习与计算机视觉计算机视觉概述计算机视觉就是让机器去识别摄像机拍摄的图片或视频中的物体,检测出物体所在的位置,并对目标物体进行跟踪,从而理解并描述出图片或视频里的场景和故事,以此来模拟人脑视觉系统。计算机视觉通常被叫做 机器视觉图像识别测量空间:彩色图像有RGB三个通道,每一个通道由很多个像素点构成,表示图像的这些数据,我们把他叫做测量空间。图像识别基本框架:场景识别、目标识别、人脸识别…… 早期图像处理 用全局的视觉底层特性统计量表示图像原创 2021-12-10 15:33:38 · 1824 阅读 · 0 评论 -
手写数字识别
手写数字识别任务输入:一系列手写数字图片,其中每张图片都是28x28的像素矩阵。任务输出:经过了大小归一化和居中处理,输出对应的0~9的数字标签。MNIST数据集MNIST数据集是深度学习领域标准,易用的成熟数据集。由6万个训练样本和1万个测试样本组成,每个样本都是一张28*28像素的灰度手写数字图片。data包含三个元素的列表:train_set、val_set、 test_set,包括50 000条训练样本、10 000条验证样本、10 000条测试样本。每个样本包含手写原创 2021-12-10 15:28:46 · 19297 阅读 · 2 评论