自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 【原创】深度学习第19弹:基于深度学习的纯视觉自动驾驶

一、前言 一年多前偶然看到一段Tesla的自动驾驶视频,对于当时还是人工智能小白的我来说太震撼了,于是决定自学人工智能并实现玩具小车的自动驾驶。二、关键词语 树莓派:一个微型计算机,运行Linux系统,可以直接控制电机,舵机等等,用来做小车控制中心。 摄像机:160度广角摄像机,负责采集图像 DAVE-2神经网络:根据采集的图像,预测转向角度。三、效果视频selfDriveVer1.0四、总结 虽然小车能自主的在跑道内行驶,但是...

2021-12-20 19:47:40 1064

原创 【原创】深度学习第18弹:基于MobileNet的手势识别

一,原文链接【原创】深度学习第18弹:基于MobieNet的手势识别二,效果视频

2021-10-20 20:18:16 674

原创 【原创】深度学习第17弹:基于VGG16的手势识别

一、前文回顾在图像处理章节使用mediapipe进行了手势1-9的识别,但是既然学习了深度学习,所以我尝试使用深度学习来实现手势识别。二、关键词语Mediapipe:谷歌的一个训练好的神经网络模型。这个模块可以识别手,脸,姿态等等很多东西。我这次只使用手部识别的功能,以便确定手的位置Tensorflow:谷歌的开源深度学习框架。这个框架封装了底层算法(比如池化操作,卷积操作,反向求导等等),我们只需要象搭积木一样就可以很快的搭建自己的网络模型。※tensorflow版本为2.6.0

2021-10-18 18:10:36 2021 2

原创 【原创】图像处理第5弹:面部表情识别--微笑

一、前言mediapipe模块还提供了面部468个特征点的检测,所以拿来试试做一个面部表情的检测。这次要实现两个目标:1.面部检测2.微笑表情检测二、算法原理1.面部检测依旧是采用谷歌的mediapipe模块来获取面部的468个特征点。然后根据需要提取出我们想要的特征点坐标。※确定468个特征点分别是脸部的哪个位置,实在是个比较繁琐的工作。2.微笑表情检测微笑表情的话,其实网上有很多范例,但是大多都是基于嘴巴裂开的程度以及眼睛眉毛的位置变化来检测。虽然...

2021-09-26 10:11:40 2204

原创 【原创】图像处理第4弹:引体向上检测并计数

一、前言前面我们介绍了俯卧撑检测以及自动计数,今天想对引体向上也做一个类似的检测。依旧是三个目标:1.检测俯卧撑以及引体向上姿势2.俯卧撑,引体向上分别计数3.检测结果输出。(Chin-up:计数、push-up:计数)二、算法原理※俯卧撑的检测以及计数在上节已经实现了,这里主要介绍引体向上的内容。1.引体向上检测我么还是沿用谷歌的mediapipe模块来获取身体各个部位的三维坐标。引体向上姿势的特点就是身体处于一个直立状态,也就是腰,肩,膝盖大约处于同一个垂..

2021-09-12 12:35:41 2878 9

原创 【原创】图像处理第3弹:俯卧撑检测并计数

一、前言前面我们介绍了手势检测以及手势识别,今天要说的是姿势检测及识别。因为我个人有运动的习惯,所以就以最基础的俯卧撑为例,实现以下三个目标:1.检测到俯卧撑姿势2.俯卧撑计数3.检测结果输出。(push-up:计数)二、算法原理1.俯卧撑姿势检测我么还是沿用谷歌的mediapipe模块来获取身体各个部位的三维坐标。mediapipe会给我们返回以下内容。如图所示,返回值总共有33个点的信息,每个点包含了该点的横轴,纵轴以及深度信息,也就是该点三维信息。有了这些点的信息我们就可以设计算法

2021-09-05 12:42:56 3068 3

原创 【原创】图像处理第2弹:手势识别

一、前言生活中我们偶尔会用手势来比划数字0-9,比如拳头代表0,拇指代表5,其余每个指头代表1。通过拇指和其余四根手指的配合就可以表示0-9的数字,所以我今天想做的就是识别这10个手势。。二、算法原理首先我们介绍下mediapipe模型的返回值如图所示,返回值总共有21个点的信息,每个点代表一个手关节,0代表手腕。每个点包含了该点的横轴,纵轴以及深度信息,也就是该点三维信息。有了这些点的信息我们就可以设计算法来对手势进行识别。因为手指弯曲就代表该手指不计数,伸直才会计数,所以我的想法是通过判定每

2021-08-29 13:57:29 2036

原创 【原创】图像处理第1弹:手势检测

【原创】图像处理第1弹:手势检测一、前言深度学习已经告一段落,虽然充满了各种枯燥的公式和代码,但还是跌跌撞撞的说完了。说实话我自己都差点放弃,不过风雨过后便是彩虹,接下来就进入实战阶段,用传统图像处理和深度学习来玩一些好玩的东西。今天要介绍的是一个手势检测模块,个人感觉很有意思。这个技术该怎么样落地为产品暂时还没有想法,所以暂且就当充实自己的武器库了。二、手势检测人脸检测现在在我们生活中已经很普及了,手势检测的原理其实也是差不多,但是因为面部具有高对比度图案,例如,在眼睛和嘴巴区域,而手部缺乏此类

2021-08-29 13:47:48 564 2

原创 【原创】深度学习第7弹:小D识数字(MNIST手写数字集)

这里写自定义目录标题一、前文回顾二、MNIST手写数字数据集1.什么是MNIST手写数字数据集2.MNIST手写数字数据集下载三、重构神经网络1.为什么要重构神经网络2.重构什么样的神经网络四、识别数字1.识别模块2.加载数据集模块3.识别步骤总结五、总结一、前文回顾 前面我们说了那么多理论,什么神经网络,激活函数,Softmax函数等等,那么深度学习到底能干什么?这一节我们就来尝试让小D识别手写数字,看看效果怎么样。这里用到的手写数字就是来自于MNIST手写数字数据集。二、MNIST手写数字数据集

2021-05-12 19:28:09 464

原创 【原创】深度学习第6弹:雷劈小D

这里写自定义目录标题一、前文回顾二、实现小D1.信号的传输2.Softmax函数是什么3.为什么要用Softmax函数4.Python实现小D三、雷劈小D四、总结一、前文回顾 上一节设计了小D的神经网络结构,并且了解了激活函数。但是小D到底是死是活?我也不知道,于是我决定召唤两道闪电,给小D点刺激,看看它有没有反应。※这节充满了代码以及线性代数,枯燥乏味到我都不想写。二、实现小D1.信号的传输 为了容易理解接下来的内容,先规定一下标记符号。 我们在第一节就提到过权重,来看下面的神经网络图。我们

2021-05-08 19:57:13 237

原创 【原创】深度学习第5弹:以其人之道还治其人之身

文章目录一、前文回顾二、激活函数1.阶梯函数2.sigmoid函数3.ReLu函数三、激活函数的区别四、总结一、前文回顾 上一节我们为小D设计了大脑(四层神经网络)以及下面的激活函数。 这里的h(s1)激活函数我们称之为阶梯函数。上节也说过激活函数有很多种,今天主要对以下三个进行讲解: ①阶梯函数 ②sigmoid函数 ③ReLu函数二、激活函数1.阶梯函数Python实现import numpy as npimport matplotlib.pylab as pltd

2021-05-05 15:32:09 221

原创 【原创】深度学习第4弹:小D的诞生

文章目录一、前文回顾二、神经网络1.小D的构造2.小D会对刺激做出何种反应三、总结一、前文回顾 上一节我们通过一个简单的神经网络(↓图)模拟了逻辑异或门,并且为它命名为小D。 但是你会发现小D只有一个输出,这意味着它的大脑里面只认识一个东西(假如是肉夹馍),那么你不管问它什么,它的回答都永远是肉夹馍。。所以我们需要对它进行改进一下。二、神经网络1.小D的构造 在这里我们为小D设计了一个四层神经网络,从左到有分别为输入层,中间层,输出层。每一层的神经元都与下层的每个神经元连接。 ①输入层:

2021-05-05 07:30:06 228

原创 【原创】深度学习第3弹:神经元的极限

文章目录一、前文回顾二、异或门是什么?三、线性与非线性1.线性2.非线性四、神经元的极限五、总结一、前文回顾上一节我们通过神经元模拟了逻辑与,非,或门。你会发现他们的构造其实一样的,都是一个神经元,不同的是权重值不一样,那么同样的方法我们来模拟一下另外一个逻辑电路:异或门XOR二、异或门是什么? XOR门就是对于两个输入信号x1或者x2,相同则输出0,相异则输出1的一种逻辑电路。如下表所示:x1x2y000101011111 那么

2021-05-03 09:53:01 392

原创 【原创】深度学习第2弹:感知机和与非门

文章目录前文回顾一、与非门是什么?二、偏置项(bias)2.读入数据总结前文回顾感知机:人工神经元权重:输入信号有多重要阈值:触发某一事件的临界值它们之间的关系: 上一节我们了解了感知机(人工神经元)的构成以及工作原理,这节我们利用神经元来模拟一些简单的问题,也就是模拟与非门。一、与非门是什么? 与门就是对于两个输入信号x1或者x2,只有两个输入信号都为1,则输出y为1,否则输出y为0.x1x2y000100010111

2021-05-02 15:17:21 609

原创 【原创】深度学习第1弹:从神经元到感知机

**前言**要想跑需要先学会走,任何复杂技术的背后其实都是依赖像1+1=2这样简单的理论来支撑的,所以基础很枯燥但也重要。**深度学习(DeepLearning)**人工智能现在已经慢慢的深入我们的生活之中。比如人脸识别,语音翻译,自动驾驶等等。环顾我们四周,以前一部分只有人可以做到的事情,现在人工智能也能做,甚至做的比人类更好。然而这么牛X的东西背后都有哪些技术呢?不知道没关系,因为我也不知道。但是我知道这其中有一项很很很重要的技术就是【深度学习】。什么是深度学习?怎么实现?那你

2021-04-30 16:42:12 248 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除