- 博客(8)
- 资源 (4)
- 收藏
- 关注

原创 零基础手把手训练实践-图像分类模型-基于达摩院modelscope
图像分类模型是最简单的,也是最基础的计算机视觉任务,应用非常广泛。本文将手把手介绍零基础训练图像分类模型的实践过程。文章主要介绍如何在标注好的数据集基础上,进行微调,使模型能够在新的数据上重新适配一个新的分类任务。
2023-04-14 06:01:02
5832
1

翻译 Next-ViT论文详解
由于复杂的注意力机制和模型设计,大多数现有的ViTs在现实的工业部署场景中不能像CNNs那样高效地执行,例如TensorRT和CoreML。视觉神经网络能否设计为与CNN一样快的推理和与ViT一样强大的性能?最近很多工作试图设计CNN-Transformer混合架构来解决这个问题,但这些工作的整体性能远不能令人满意。为了结束这些,本文作者提出了在现实工业场景中有效部署的,即Next-ViT,从延迟/准确性权衡的角度来看,它在CNN和ViT中均占主导地位。
2022-12-14 00:23:31
878
原创 NextViT: 一款优秀的实时中文日常物品图像分类模型
实验结果表明,在分类、检测、分割任务上,NextViT模型的性能达到了SOTA,例如在与CSWin相当的性能下,推理速度提高了3.6倍,这是其他图像分类模型无法比拟的。在现有的ViT模型中,由于较高计算复杂度的注意力机制,很难在现实的工业部署场景中像CNNs那样高效地执行,但NextViT模型采用了基于TensorRT的实时落地技术,能够在现实的工业部署场景中高效地执行。模型,它是一款基于Transformer的实时中文日常物品图像分类模型,其在计算机视觉领域中具有极高的准确性和速度,值得广泛推广应用。
2023-02-18 17:57:57
597
1
原创 达摩院modelscope模型开源平台推出快速体验ViT模型
ViT(Vision Transformer)模型是近期出现的一种基于注意力机制的图像分类模型,它将计算机视觉任务与自然语言处理技术相结合,有效提升了模型的表现。达摩院的ModelScope模型开源平台是一个开放的、易于使用的平台,旨在帮助广大研究者更好地理解和使用最先进的深度学习模型。可以对日常生活中的物品进行分类,比如“汽车”、“狗”、“花”等,同时还支持使用多种不同的预处理方式进行图像处理,从而更好地适应不同的应用场景。总的来说,ViT模型的出现为计算机视觉的应用带来了新的机遇。
2023-02-18 16:40:24
661
原创 ViT Transformer论文阅读笔记
首次提出使用transformer进行分类:把输入图像直接划分为token,位置编码为可学习的token,额外增加一个分类token,最后使用head预测。
2022-12-14 17:24:52
299
1
原创 (转)(三)机器学习笔记之Scikit Learn的线性回归模型初探
一、Scikit Learn中使用estimator三部曲1. 构造estimator2. 训练模型:fit3. 利用模型进行预测:predict 二、模型评价模型训练好后,度量模型拟合效果的常见准则有:1. 均方误差(mean squared error,MSE):2. 平均绝对误差(mean absolute error,MAE)3. R2
2017-10-27 10:56:33
1962
转载 (二)机器学习笔记之数据预处理
数据预处理数据预处理一般包括:(1) 数据标准化这是最常用的数据预处理,把某个特征的所有样本转换成均值为0,方差为1。将数据转换成标准正态分布的方法:对每维特征单独处理:其中,可以调用sklearn.preprocessing中的StandardScaler()进行数据的标准化。(2) 数据归一化把某个特征的所
2017-10-26 21:19:54
770
原创 (原创)(一) 机器学习之数据探索
my_FE_BostonHousePrice /*!** Twitter Bootstrap**//*! * Bootstrap v3.3.7 (http://getbootstrap.com) * Copyright 2011-2016 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/boots
2017-10-26 10:27:33
1065
垃圾分类模型和生活垃圾分类数据集
2023-02-01
凌阳语音识别超声波测量系统程序
2011-04-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人