error:404..-优快云博客

1 论文整体结构tips：1.论文格式字数等必须符合所投期刊要求2.论文查重是基本要求3.title和abstract是论文的精化，决定了审稿人对整篇论文的印象4.论文原创性准确性科学性行文逻辑细节都应该把握5.好的图片和表格会给审稿人眼前一亮，所以对图片和表格应该重视2 introduction引言就是自圆其说，建立一个逻辑体系引导读者，主要包含的内容：对于motivation主要就是强调这个...

2022-04-07 21:16:11 609

原创 PaStaNet: Toward Human Activity Knowledge Engine

文章：https://arxiv.org/abs/2004.00945代码：https://github.com/DirtyHarryLYL/HAKE-Action官网：home0 前言核心思路：首先推理human part states（即PaSta，形式如<hand,hold,something>），再用part-level的语义去推理动作。首先用一个叫Activity2Vec的模型去提取PaSta特征，再用一个基于PaSta的方法去推理activity（个人理解：提..

2021-12-03 16:20:20 422

原创 HigherHRNet详解之源码解析

论文：《HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation》论文链接：https://arxiv.org/pdf/1908.10357.pdf代码链接：https://github.com/HRNet/HigherHRNet-Human-Pose-Estimation姿态估计前言知识：姿态估计-前言知识_error:404..的博客-优快云博客HigherHRNet详解之实

2021-11-04 21:18:46 2555 5

原创 HigherHRnet详解之论文详解

论文：《HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation》论文链接：https://arxiv.org/pdf/1908.07919.pdf代码链接：https://github.com/HRNet/HigherHRNet-Human-Pose-Estimation姿态估计前言知识：姿态估计-前言知识_error:404..的博客-优快云博客HigherHRNet详解之实

2021-11-01 09:39:49 1138

原创 HigherHRnet详解之实验复现

论文：《HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation》论文链接：https://arxiv.org/pdf/1908.07919.pdf代码链接：https://github.com/HRNet/HigherHRNet-Human-Pose-Estimation1.前言HigherHRNet 来自于CVPR2020的论文，论文主要是提出了一个自底向上的2D人体姿态估计网

2021-10-29 16:24:42 4325 21

原创姿态估计-前言知识

目录1.自顶而下和自下而上的区别2.以COCO数据集为例解释评价指标3.single-scale和multi-scale4.推荐干货1.自顶而下和自下而上的区别在姿态估计任务中，经常看见别人论文上提到这是自顶而下或者自下而上方法，那么怎么区分两者自顶向下的算法先从图像中检测出所有人，随后利用单人姿态估计的方法对所有人进行姿态估计。自顶向下算法的缺点是算法运行效率随着人数增加而降低，且部分被遮挡的人无法被检测，精度不高。自底向上的算法，先检测出所有人的骨点，再将骨点进行连接

2021-10-25 11:03:20 708

原创 pytorch简单实现GCN

论文：SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS前言：学习图卷积刚入门，看了一篇GNN开山之作，而后看了最开始的四代GCN，每一代都在上代上有所更新，大致明白了GCN的发展以及原理，这篇论文是这个系列最后一篇，也是这篇论文中出现了现在GCN的逐层传播公式，后续最新的图网络都是在这个基础上进行更新，个人觉得这四篇论文对图网络感兴趣的朋友入门还是很有帮助的。这篇文章主要是针对最终得出来的公式进行翻译，简单测试。1.

2021-10-21 16:14:40 5533 2

原创 RNN与LSTM网络

前言RNN网络可以用于情感分析，与语言相关的工作，比如一个例子一个电影的评论，系统分析它是好评还是差评。假设每个单词可以用[100]表示（这种序列表示方法简单地说就是有100个单词，[1,0,...],[0,1,0...]这些表示一个单词），上图的五个单词就是输入，也就是一个[5,100]的数据。分别将5个单词输入线性层，得出5个Linear[2]，也就是一个[5,2]数据，最后输出概率，判断是差评还是好评。改进但是这种方法存在两个问题1.输入单词很多，每个单词...

2021-08-29 22:50:53 160

原创 TSN源码分析

本文是在阅读了TSN论文以及复刻了TSN实验的基础上进行的TSN源码分析。1.源码准备直接在github中拉去源代码：git clone --recursive https://github.com/yjxiong/tsn-pytorch 2.源码结构源码中的结构如下：main.py 训练模型 test_models.py 测试模型 opts.py 参数配置 dataset.py 数据读取 models.py 网络结...

2021-08-21 16:40:33 2218 1

原创 TSN实验过程

前言本文主要是为了复刻TSN论文中的实验，使用的是UCF101数据集。1.数据集及源码准备1.1数据集介绍在视频分类项目中，有很多经典的公开数据集，目前主要的数据集如列表所示：UCF101是动作识别数据集，从Youtube收集而得，共包含101类动作。其中每类动作由25个人做动作，每人做4-7组，共13320个视频，分辨率为320*240。UCF101在动作的采集上具有非常大的多样性，包括相机运行、外观变化、姿态变化、物体比例变化、背景变化、光纤变化等。主要结构为...

2021-08-15 23:02:19 1614 2

原创 TSN论文笔记

前言深度神经网络在视频中的动作识别中优势并不明显。因此，提出了一种改进后的网络，时间段网络(TSN)，它是用一种新的基于段的采样和聚合模块来建模长程时间结构，TSN能够有效地学习动作模型，通过简单的平均池化和多尺度时间窗融合，学习的模型可以很容易地适应修剪视频和未修剪视频的动作识别。1.基于视频的动作识别面临的困难对于视频中的动作识别，有两个至关重要且相互补充的线索:表象和时间动态。识别系统的性能在很大程度上取决于它是否能够从中提取和利用相关信息，但是，提取有用信息并非易事，如比例变化...

2021-08-13 19:39:01 712

原创卷积神经网络(CNN)反向传播

目录前言前向传播1.1卷积层前向传播1.2池化层前向传播1.3全连接层前向传播2.损失函数3.反向传播3.1已知池化层，求上一层3.2已知卷积层，求上一层3.3卷积层更新W和b4.总结前言卷积神经网络是计算机视觉的最基础网络，可以让计算机很好的模拟人的眼睛，主要方法就是提取出特定事物的特征，根据特征对事物进行识别，那么在卷积神经网络训练时，梯度是怎么变化的，卷积神经网络中的权重参数是怎么更新的，本文对重点对卷积神经网络中的反向传播进行讨论。...

2021-08-05 12:58:59 3780

原创软件工程画图

1.工具介绍visio以及starulm都是不错的画图工具，visio可以自定义模具，一些不规则的模具可以在里面自定义，staruml是是一款开放源码的UML开发工具，主要支持9种uml建模，支持语法检测以及正反向工程。2.N/S图与PAD图这两种图可以用visio软件画，选取矩形模具，必要的时候在开始-指针工具调整为直线，连接，很多不规则的模具直接用直线进行构建即可，PAD图的选择模具可以自己新建一个模具，然后保存，再使用例：void root ( float root1, fl

2021-08-03 15:34:39 8937

原创 Supervised Contrastive Learning浅读

前言本文是根据观看了知名油管up主，对Supervised Contrastive Learning这篇文论文的解读写了一点自己的理解，初次接触，理解甚浅。在文章中作者提出了一种新的监督训练的loss, 这种loss 是基于contrast loss的优化目标，与之前的监督学习不同，它是每个锚点取多个正例，目的是使相同label 的normalized embedding 尽可能接近，不同label的尽可能远。最终结果证明，新的loss要比cross entropy训练更加稳定，并且在分...

2021-07-31 23:59:50 2781 2

原创基于CNN的手写字符识别demo中参数的设置

目录前言1.优化算法比较2.初始学习率参数3.batch_size参数4.数据预处理参数5.正则化参数的选择5.1Regularization参数5.2.dropout参数的选择6.归一化以及激活函数选择前言之前已经用最简单的CNN网络实现了对MNIST数据集的分类问题，并且通过对参数以及网络结构的优化使模型的性能达到了一个不错的状态，本文将对所有参数进行调整比较，分析不同参数在CNN网络训练中的影响，主要是通过控制变量法，对loss以及acc曲线的分...

2021-07-24 17:59:08 549

原创使用ResNet18处理cifar10数据集

前言1.数据集介绍CIFAR-10数据集由10个类的60000个32x32彩色图像组成，每个类有6000个图像。有50000个训练图像和10000个测试图像。数据集分为五个训练批次和一个测试批次，每个批次有10000个图像。测试批次包含来自每个类别的恰好1000个随机选择的图像。训练批次以随机顺序包含剩余图像，但一些训练批次可能包含来自一个类别的图像比另一个更多。总体来说，五个训练集之和包含来自每个类的正好5000张图像。里面类别包括飞机，汽车，鸟，猫，鹿，狗，青蛙，马，船，卡车十个类..

2021-07-23 00:04:44 3489 1

原创机器视觉任务类别与实现过程概述

目录前言1.语义分割1.1滑动窗口1.2全连接网络2.分类与定位3.目标检测4.实例分割前言在至少约十年的时间里，用于解决计算机视觉领域问题的技术已经有了很大的改进。那对于计算机视觉领域存在的问题有哪些呢？一些显著的问题是：图像分类、目标检测、图像分割、图像说明等。并且分析各种任务的解决方法以及原理。1.语义分割语义分割不仅是对图片中的某一位置分类，它是对图像中的每一个像素都进行分类。1.1滑动窗口对于这类问题，可以用滑动窗口进行实现，每次...

2021-07-22 18:26:01 355

原创训练神经网络--优化方法及其优化器

前言在训练神经网络的时候，有归一化，正则化等优化模型性能的方法，但是在做这些优化之前，我们需要确定一种优化方法或者说是优化器，优化方法会对模型的性能有不少的影响，pytorch里面自带了不少优化器，可以自动的更新梯度，loss等参数，是比较方便的。1.随机梯度下降法--SGD对比批量梯度下降法，假设从一批训练样本n中随机选取一个样本，模型参数为，代价函数为，梯度为，学习率为，则使用随机梯度下降法更新参数表达式为：其中，,表示随机选择的一个梯度方向表示t时刻的模型参数...

2021-07-21 23:20:18 764

原创训练神经网络--正则化

在平时训练神经网络时，总会出现过拟合现象，也就是模型与测试集数据过度拟合，导致模型泛化性很低，在测试集上的准确率变得很低。正则化是处理过拟合的方法之一1.Regularization通常我们在损失值上加上噪声通常我们会用下面三种误差项具体实现方式可以参考https://blog.youkuaiyun.com/jinping_shi/article/details/524339752.Dropout我们直接在神经元的传递之间舍弃一些值，减少了神经网络的复杂程度dropo...

2021-07-19 23:46:10 305 3

原创训练神经网络--批量归一化

目录1.前言2.BN概述2.1数据预处理2.2算法实现2.3源码实现3.归一化作用1.前言我们知道在神经网络训练开始前，都要对输入数据做一个归一化处理，那么具体为什么需要归一化呢？归一化后有什么好处呢？原因在于神经网络学习过程本质就是为了学习数据分布，一旦训练数据与测试数据的分布不同，那么网络的泛化能力也大大降低；另外一方面，一旦每批训练数据的分布各不相同(batch 梯度下降)，那么网络就要在每次迭代都去学习适应不同的分布，这样将会大大降低网络的训练速度，这也正是为什么我们

2021-07-19 21:43:15 642

原创浅析决策树

1.前言决策树是一种常见的机器学习方法，决策树是基于树的结构来进行决策的，在现实中我们通常会进行一系列的判断或“子决策”。本文主要是对西瓜的好坏的决策分类，来对决策树的工作原理进行讲解。2.基本算法以上算法中有三个中断递归的条件，（1）当前的结点样本全都是一个类别的，不需要划分（2）当前的属性集没有样本后者所有样本在所有属性上取值相同（理解为无效的属性）（3）当前节点包含的样本集合为空，不能划分注：（2）（3）都需要将此节点设为叶子节点，但是（2）其类别为当前节点所含样本属性...

2021-07-19 17:35:00 231

原创训练神经网络--激活函数

1.激活函数1.1sigmiod函数这是最早期神经网络用的一种激活函数，是非线性的，将元素压缩到[0,1]上，但是在元素趋很大或者很小（负数）的时候，可以看成是线性的sigmoid函数跟所有激活函数一样实现了元素非线性化，更加贴近于实际。但是缺点很明显，（1）当元素处于函数的正饱和区域或者负饱和区域的时候，或出现梯度消失现象（2）sigmoid函数不是关于0对称的，梯度只会朝着一个方向更新，导致梯度更新效率低。设一个神经元为f（∑wi*xi+bi），那么w的梯度为dl/dw=x...

2021-07-18 23:25:12 525

原创基于CNN模型的手写字符识别的分析与实现过程

1.前言MNIST是一个手写体数字的图片数据集，该数据集来由美国国家标准与技术研究所（National Institute of Standards and Technology (NIST)）发起整理，一共统计了来自250个不同的人手写数字图片，其中50%是高中生，50%来自人口普查局的工作人员。该数据集的收集目的是希望通过算法，实现对手写数字的识别。被广泛地应用于机器学习和深度学习领域，用来测试算法的效果，例如线性分类器（Linear Classifiers）、K-近邻算法（K-Nearest ..

2021-07-17 16:22:25 7445

空空如也

空空如也