机器(深度)学习
文章平均质量分 94
达达_
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
PySlowFast 平台的使用及解析——以X3D为例
1.概述PySlowFast 是Facebook近期开源的一个视频理解项目,其中包含了数个优秀论文的实现,包括SlowFast、X3D、I3D等。项目的地址在这里,本人最近正在做用该项目作视频行为识别的相关内容,因此本文讲述在应用PySlowFast的一些问题,主要是展示代码的运行过程。在查看相关论文后,发现X3D是项目中无论是准确率还是速度比较优秀的一个,因此采取该方案来做行为识别。2. PySlowFast解读下边结合代码来解读PySlowFast框架的运行。因为项目工作时间有限,只对训练部分作了原创 2022-01-19 17:57:31 · 4455 阅读 · 10 评论 -
mmdetection学习系列(1)——SSD网络
1. 概述本文是本人自学mmdetection的第一篇文章,因为最近一段时间在做目标检测相关的内容,为了更好地研究领域内相关知识,特意花了不少时间熟悉mmdetection框架(https://github.com/open-mmlab/mmdetection)。边啃代码的同时边通过知乎openMMlab社区(https://www.zhihu.com/people/openmmlab)来了解其框架结构。刚开始看时由于对目标检测的整个流程还不算十分熟悉,而由于mmdetection是可以适用于多种网络的,原创 2021-06-01 20:55:25 · 6349 阅读 · 7 评论 -
吸烟行为检测
@目录项目概述yolov5详解优化方法项目概述项目的目标是设计出一个模型,用于检测普通大楼内外的行人是否存在吸烟的行为。项目硬件限制较大,需要用单个或数个GPU监控小区数百个摄像头,视频的取样频率只能达到一秒或者数秒一帧,因此基于时序的行为识别算法并不适用。经过初步考虑决定使用目标检测算法对图片中的香烟进行检测,目前精度较高且速度高部署方便的大概只有yolov5,因此本项目采取yolov5-4.0版本进行。https://github.com/ultralytics/yolov5/tree/v4.原创 2021-03-29 16:09:23 · 10669 阅读 · 21 评论 -
Kaggle之房价预测解读
题目来源https://www.kaggle.com/c/house-prices-advanced-regression-techniques本文部分代码参考https://www.kaggle.com/serigne/stacked-regressions-top-4-on-leaderboard本题是利用给出的每个房子的80个特征(如房屋面积,年龄等),预测其销售价格。评价预测的指标是...原创 2019-08-10 16:58:49 · 2759 阅读 · 1 评论 -
机器学习知识点总结
1. LR原理LR模型是通过把特征进行线性组合,再把组合通过一层sigmoid函数映射成结果为1或0的概率设一个样本属于正样本的概率为p,则P(Y=1∣x)=ew⋅x1+ew⋅xP(Y=1|x)=\frac{e^{w\cdot x}}{1+e^{w\cdot x}}P(Y=1∣x)=1+ew⋅xew⋅xP(Y=1∣x)=11+ew⋅xP(Y=1|x)=\frac{1}{1+e^{w\cd...原创 2019-04-19 21:04:08 · 655 阅读 · 0 评论 -
机器学习之贝叶斯分类
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的基础上得出的分类方法。朴素贝叶斯法实现简单,学习与预测效率高,是一种常用的方法。当样本中的各个变量独立时,朴素贝叶斯法所得出的分类结果准确率是最高的。但是这个条件比较苛刻,在实际情况中各个变量往往具有相关性。即使如此,当变量之间相关性较低时,贝叶斯分类依然有较好的分类性能。下边结合李航老师的统计学习方法以及一些网站用例子来直接理解贝叶斯分类。1....原创 2019-03-18 21:59:20 · 1749 阅读 · 0 评论 -
机器学习之逻辑回归
逻辑回归(Logistic regression)是统计学习中经典的分类方法,其基本用法是用于二分类,但是也很容易推广到多分类。1.逻辑函数(sigmoid 函数)首先介绍一下sigmoid函数,其基本形式如下:g(x)=11+e−xg(x)=\frac{1}{1+e^{-x}}g(x)=1+e−x1其图像如下当z趋向无穷大时,g(z)趋向与1,当z趋向无穷小时,g(z)趋向于0。...原创 2019-03-10 15:48:44 · 263 阅读 · 0 评论 -
决策树
本文主要讲述决策树的原理,优缺点,以及使用方法。部分内容参考统计学习方法1.什么是决策树决策树是一种基本的分类和回归方法,其模型呈树形结构,可以认为是if-then的规则集合。其优点是具有很好的可读性,训练和预测的速度快。训练时,利用训练数据,根据损失函数最小化的原则建立决策树模型,预测时,直接利用模型进行分类或回归。决策树训练通常包括3个步骤:特征选择、决策树生成以及修剪。后边的章节会对其进...原创 2019-02-27 22:13:18 · 4100 阅读 · 0 评论 -
c++ 实现K近邻算法
本文部分内容参考与这里和这里本文着重于介绍用c++实现K近邻算法。首先介绍一下K近邻算法的原理和优缺点。KNN算法原理对于一个数据样本集合,每条数据都有对应的标签。当输入一个新的,没有标签的数据时,算法将新数据的每个特征与样本中对应的特征进行比较。然后选取数据集中前k个最相似的数据,其中出现最多的标签分类,作为新数据的分类。优点精度高,对异常值不敏感,无输入数据假定缺点计算复杂度高...原创 2019-01-26 11:10:29 · 5525 阅读 · 1 评论 -
Kaggle之泰坦尼克号
本文大部分内容参考于这里以及这里,主要用于自己阅读后的总结以及结果的复现。Titanic 是kaggle上每个新手都要接触的第一个项目。机器学习在最开始创建模型的时候不要先想着做得完美,可以先做一个baseline出来,再慢慢挖掘数据的特征优化模型。前人说过,对数据的特征分析比模型的建立还重要,因此打算用Titanic这个数据集,对特征分析(feature engineering) 作一个深入...原创 2019-01-21 10:15:01 · 927 阅读 · 0 评论 -
图像识别与卷积神经网络
卷积神经网络是除了全连接神经网络以外另一个常用的网络结果,其在图像识别方面表现十分突出。本文结合Tensorflow:实战Google深度学习框架,讲述卷积神经网络常用数据集,介绍卷积网络的结构思想,以及通过TensorFlow实现其设计。1 图像识别数据集MNIST手写体识别数据集解决是一个相对简单的问题,而对于更加复杂的类别,可以用到CIFAR数据集。比如CIFAR10数据集收集了来自10...原创 2019-01-10 20:33:22 · 9539 阅读 · 1 评论 -
深层神经网络(DNN)的一些基本概念
本文介绍一些DNN的概念,包括激活函数、损失函数、优化算法等声明:本文的主要内容及代码主要来源于实战Google深度学习框架1 激活函数DNN的最大突破就是引入了非线性激活函数,如果没有激活函数,那么无论神经网络深度如何,它与一个1层网络本质上是没有区别的。通过增加网络的层数,并且在层与层之间添加非线性项以及偏置项f(∑ixiwi+b)f( \sum \limits_{i}x_iw_i+b)...原创 2018-12-14 16:22:56 · 4629 阅读 · 0 评论 -
MNIST数字识别问题
MNIST是手写体识别数据集,是大多数深度学习教程的入门资料。本文结合这个数据集,利用TensorFlow搭建神经网络。介绍了变量重用和名称空间的问题。以下的代码以及内容,基本上来自Tensorflow:实战Google深度学习框架1 MNIST介绍MNIST是一个手写体数字识别数据集,它包含了60000张图片作为训练数据,10000张图片作为测试数据。每张图片代表0-9中的其中一个数字,图...原创 2018-12-19 20:10:54 · 701 阅读 · 0 评论 -
TensorFlow入门
声明:本文的主要内容及代码主要来源于实战Google深度学习框架1.TensorFlow数据模型——张量TensorFlow的张量和数学上的张量十分相似,简单来说可以用来表示一个多维数组,TensorFlow中实现张量并不是直接采用数组的形式,只是对运算结果的一个引用,如下:import tensorflow as tfa = tf.constant([1.0,2.0],name='a')...原创 2018-12-12 21:30:30 · 639 阅读 · 2 评论
分享