- 博客(197)
- 资源 (1)
- 收藏
- 关注
原创 caffe 学习
caffe 教程:https://www.cnblogs.com/denny402/p/5067265.htmlcaffe 编译安装:https://www.cnblogs.com/denny402/p/5067265.htmlcaffe conda 安装:https://blog.youkuaiyun.com/weixin_39916966/article/details/93221564问题解决caffe 报错:https://blog.youkuaiyun.com/weixin_38883095/ar
2020-11-06 15:22:22
230
原创 siamase -network
siamase 是 一种神经网络的框架,而不是具体的某种网络,就像seq2seq 一样,具体实现上可以使用RNN 也可以使用CNN,两个子网络共享权值。网络将输入映射到新的空间,形成输入在新的空间中的表示。正向传递:1 不再使用softmax 多分类,把图片encoding 一个长vector2 图片相似性:不同vector 的相似性对比。3 相似方程由两部分构成: similarity function=encoding f0 + vector 之间的distanceref:http.
2020-10-22 19:55:48
540
原创 层次贝叶斯模型
1 概念:层次贝叶斯模型是具有结构化层次的统计模型,它可以用来为复杂的统计问题建立层次模型从而避免参数过多导致的过拟合问题。通过贝叶斯方法来估计后验分布的参数。2 推断过程:我们对层次贝叶斯推断的策略与一般的多参数问题一样,但由于在实际中层次模型的参数很多,所以比较困难,在实际中我们很难画出联合后联合概率分布的图形。但是可以使用近似的基于仿真的方法.运用层次贝叶斯模型主要需要计算所有参赛在已知观察量下的条件后验概率,其推导过程主要包含三个步骤:1)写出联合后验密度,p(θ, φ|y),.
2020-10-22 16:41:48
8539
原创 Vision Transformer 论文
https://openreview.net/pdf?id=YicbFdNTTyAN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALEAbstract:Transformer 架构早已在自然语言处理任务中得到广泛应用,但在计算机视觉领域中仍然受到限制。在计算机视觉领域,注意力要么与卷积网络结合使用,要么用来代替卷积网络的某些组件,同时保持其整体架构不变。该研究表明,对 CNN 的依赖不是必需的,当直
2020-10-08 19:13:19
36093
9
原创 MobileNetV2 论文
https://arxiv.org/abs/1801.04381Inverted Residuals and Linear Bottlenecks: Mobile Networks for Classification, Detection and SegmentationAbstract本文提出了一种新的移动架构MobileNetv2,改善了多个任务和基准的State-of-the-art水平。同时我们介绍了一种基于此框架的面向目标检测任务的有效应用模型SSDLite。此外,我们介绍了简化移动
2020-10-08 11:20:36
2176
原创 MobileNet v1 论文
https://arxiv.org/pdf/1704.04861.pdfSummary:总的来说,MobileNet相对于标准卷积过程有以下几点不同:1) 将标准的卷积操作分为两步:depthwise convolution和pointwise convolution。即先分解卷积滤波,再用1x1的卷积连接起来。通过文中的计算复杂度可以看出MobileNet的计算量降低了很多。2) 引入了两个超参数:width multiplier和resolution multiplier。这两个超参数的
2020-10-06 21:42:38
488
原创 sklearn 中指标计算公式
TP:正例预测正确的个数FP:负例预测错误的个数TN:负例预测正确的个数FN:正例预测错误的个数1. accuracy_score(y_true,y_pred)准确率(accuracy)是所有预测对的right/all例子:>>>y_pred = [0, 2, 1, 3]>>>y_true = [0, 1, 2, 3]>>>accuracy_score(y_true, y_pred)0.52.prec...
2020-08-13 17:13:22
1781
原创 pytorch-固定某些层参数不训练
ref:https://blog.youkuaiyun.com/Arthur_Holmes/article/details/103493886
2020-08-07 11:42:53
3447
原创 nn.Module -使用Module 类来自定义网络
1 前言: 如何自定义一个模型-通过继承nn.Module 类来实现,在__init__ 构造函数中申明各个层的定义,在forward 中实现层直接的连接关系,实际上就是前向传播的过程。实际上,在pytorch 里面自定义层也是通过继承nn.Module 类来实现,pytorch 里面一般没有层的概念,层也是当成一个模型来处理的。2 torch 里面实现神经网络有两种方法:(1) 高层API 方式: 高层API 是使用类的形式来包装的,类可以存储参数,例如全连接层的权重值矩阵,偏置矩阵等都可以作
2020-08-06 16:16:57
708
2
原创 @property 装饰器
https://www.liaoxuefeng.com/wiki/897692888725344/923030547069856
2020-08-06 14:59:35
145
原创 Mobilenet 网络结构-Depthwise Separable Convoltion
1)常规卷积运算假设输入层为一个大小为64×64 像素,三通道的彩色图片。经过一个包含4个filter 的卷积层,最终输出4个Feature Map,并且尺寸与输入层相同。此时卷积层共4个filter,每个filter 包含3个kernel,每个kernel的大小为3×3,因此卷积层的参数量如下计算:N_std=4×3×3×3×3=1082 Separable Convolution核心思想是将一个完整的卷积运算分解为两步,分别为Depthwise Convolution 与Poi.
2020-08-06 11:01:50
388
原创 CS231N斯坦福计算机视觉公开课笔记
p6 可视化卷积神经网络: 导向反向传播让轮廓更明显,找到识别最大的原始图像p9 : CNN 网络工程的实践技巧,,3*3 卷积,步长为1 ,padding =1 使得feature map 维度不变。两个3*3 替换一个5*5 ,感受野相同,可以减少参数,非线性变换的次数增多。输入H*W*C,C是通道数,要C个卷积核,卷积核大小是7*7,参数是7*7*C*C,3个3*3 来代替,参数是3*3*C*C乘法运算量: feature map 元素数* 每次卷积感受野数量: (H*W*C)*(7.
2020-08-02 16:20:45
296
原创 目标检测-评估标准
常用: 平均精度均值 mAP,交并比 IoU,非极大值抑制 NMS, 每秒帧频FPS(每秒处理的图片数量)1 AP:代表平均精度,是PR 曲线下的面积,分类器分类效果越好,AP 越大。mAP:多类别的AP 的平均值,mean 代表对每个类别下得到的AP 再求平均。mAP 的取值范围为[0,1],值越大越好。mAP 涉及到的相关概念: 混淆矩阵:TP,FP,FN,TN,Precision,Recall。F1-score 是precision和recall 的调和均值:即 2/F1=1/Pr
2020-07-28 09:58:37
722
原创 SSD 原理-1
ref:https://blog.youkuaiyun.com/qianqing13579/article/details/82106664预测阶段有两种滑动窗口的策略:1 策略1: 使用不同大小的滑动窗口,对每个滑动窗口提取特征并分类判断是否是人脸,最后经过NMS 得到最后的检测结果,本文的SSD 本质上就是这种策略,不同检测层的anchor 就类似于不同大小的滑动窗口。2 策略2:构造图像金字塔,只使用一种大小的滑动窗口在所有的金字塔图像上滑动,对每个滑动窗口提取特征并判断是否是人脸,最后经过NMS 得
2020-07-24 18:29:25
319
原创 kaggle:iMet Collection 2019 - FGVC6
1 评估指标f2 score=2 训练集与109237 张,测试集分为两个阶段,第一个阶段7443 张,第二阶段是unseen的,大小5.2 倍于test1.3 数据分析3.1 类别总数:1103 类,其中culture 有398 类,tag 有705 类3.2 每张图像所含类别个数:1~11 ,大多数图像含有2-3个标签,但是有张图像含有11个。3.3 前20的label 中的culture 和tag 分别占了整个数据集的0.72%和1.83% ,这说明大多数label 是所出现次
2020-06-29 17:45:18
408
原创 基于VAE 利用重建概率的异常检测
1 VAE和AE的区别AE 将输入变量直接编码成隐藏层变量,再解码成输出变量,VAE 也有编码和解码过程,但VAE将输入变量"编码" 成隐变量的分布,再从隐变量分布采样,将隐变量分布解压成输出变量的分布。网络学习目标变成使变量的分布函数逼近真实的分布函数,这个问题的求解需要采用变分方法,因此取名变分自编码器。2 VAE 的loss摘要: 本文提出了一种利用变分自动编码器重构概率的异常检测方法,https://www.cnblogs.com/asawang/p/10407551.html..
2020-06-23 21:54:13
2164
原创 Hadoop 编程
处理1 select: 直接分析输入数据,取出需要的字段数据即可2.where :也是对输入数据处理的过程进行处理,判断是否需要该数据3. aggregation :min,max,sum4.group by : 通过Reducer 实现5.sort6.join:map join ,reduce join...
2020-05-24 20:14:33
184
原创 hadoop Shuffle
对Map的结果进行排序并传输到Reduce 进行处理,Map的结果并不是直接存放到硬盘,而是利用缓存做一些预排序处理Map 会调用Combiner ,压缩,按key 进行分区,排序等,尽量减少结果的大小,每个Map 完成后都会通知Task,然后Reduce 就可以进行排序。Map 端当Map 程序开始产生结果的时候,并不是直接写到文件的,而是·利用缓存做一些排序方面的预处理每个Map 任务都有一个循环内存缓冲区(默认100MB),当缓存的内容达到80%时,后台线程开始将内容写到文件,此时Ma
2020-05-24 19:36:35
165
原创 hadoop 读取数据
MapReduce -读取数据通过InputFormat 决定读取的数据的类型,然后拆分成一个个InputSplit ,每个inputSplit 对应一个Map 处理,RecordReader 读取InputSplit 的内容给Map 。InputFormat决定读取数据的格式,可以是文件或数据库等。功能:1) 验证作业输入的正确性,如格式等。2). 将输入文件切割成逻辑分片(InputSplit) ,一个InputSplit 将会被分配给一个独立的Map 任务3).提供Re..
2020-05-24 17:57:22
576
原创 hadoop MapReduce
简介:一种分布式的计算方式指定一个Map(映#x5C04;) 函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。Patternmap:(K1,V1) ->list(K2,V2) combine:(K2,list(V2))-> list(K2,V2) reduce:(K2,list(V2))-> list(K3,V3).Map 输出格式和Reduce 输入格式一定是相同的。基本流程Map.
2020-05-24 17:16:45
143
原创 YARN-Failover
失败的类型1. 程序问题2.进程崩溃3. 硬件问题失败处理1 任务失败1)运行时异常或者JVM 退出都会报告给ApplicationMaster2)通过心跳来检查挂住的任务(timeout),会检查多次(可配置),才判断改任务是否失效3). 一个作业的任务失败率超过配置,则任务改作业失败4).失败的任务或作业都会有ApplicationMaster 重新运行2. ApplicationMaster 失败1). ApplicationMaster 定时发送心跳信号到
2020-05-24 16:18:34
277
原创 Hadoop Container
YARN-Container1 基本的资源单位(CPU,内存等)2. Container 可以加载任意程序,而且不限于java3. 一个Node 可以包含多个·Container,也可以是一个大的Container4. ApplicationMaster 可以根据需要,动态申请和释放...
2020-05-24 15:33:44
342
1
原创 Hadoop ApplicationMaster
YARN-ApplicationMaster单个作业的资源管理和任务监控具体功能描述:1. 计算应用的资源需求,资源可以是静态或动态计算的,静态的一般是Client 申请时就指定了,动态则需要ApplicationMaster 根据应用的运行状态来决定2. 根据数据来申请对应位置的资源(Data Locality)3. 向ResourceManager申请资源,与NodeManager 交互运行程序的运行和监控,监控申请的资源的使用情况,监控作业进度。4.跟踪任务状态和进度,定时向R
2020-05-24 15:12:10
657
原创 Hadoop NodeManager
Node 节点下的Container 管理1)启动时向ResourceManager 注册并定时发送心跳消息,等待ResourceManager 的指令2)监控Conta 的运行,维护Container 的生命周期,监控Container 的资源使用情况3) 启动或停止Container,管理任务运行时的依赖包(根据ApplicationMaster 的需要,启动Container 之前将需要的程序及其依赖包,配置文件等到本地)内部结构...
2020-05-24 14:48:51
818
原创 Hadoop ResourceManager
YARN-ResourceManager负责全局的资源管理金额任务调度,把整个集群当成计算资源池,只关注分配,不管应用,且不负责容错。资源管理1)以前资源是每个节点分成一个个的Map slot和Reduce slot ,现在施一个个Container,每个Container 可以根据需要运行ApplicationMaster, Map, Reduce 或者任意的程序。2)以前的资源分配是静态的,目前是动态的,资源利用率更高。3)Container 是资源申请的单位,一个资源申请格式:&l
2020-05-20 18:07:32
1470
原创 Hadoop YARN
1.旧的MapReduceJobTracker: 负责资源管理,跟踪资源消耗和可用性,作业生命周期管理(调度作业任务,跟踪进度,为任务提供容错)TaskTrader: 加载或关闭任务,定时报告任务状态此架构会有以下问题:(1) JobTracker 是MapReduce 的集中处理点,存在单点故障(2) JobTracker 完成了太多的任务,造成了过多的资源消耗,当MapReduce job 非常多的时候,会造成很大的内存开销,这也是业界普遍总结出老Hadoop 的MapReduc
2020-05-20 11:07:03
185
原创 Hadoop 命令工具
HDFS-命令工具fsck: 检查文件的完整性start-balancer.sh: 重新平衡HDFShdfs dfs -copyFromLocal 从本地磁盘复制文件到HDFS。
2020-05-20 09:20:58
139
原创 hadoop 可靠性
HDFS-可靠性1. DataNode 可以失效DataNode 会定时发送心跳到NameNode,如果一段时间内NameNode没有收到DataNOde的心跳消息,则认为其失效,此时NameNode 就会将该节点的数据(从该节点的复制节点中获取)复制到另外的DataNode 中。2. 数据可以毁坏无论是写入时还是硬盘本身的问题,只要数据有问题(读取时通过校验码来检测),都可以通过其他的复制节点读取,同时还会再复制一份到健康的节点中3.NameNode 不可靠。...
2020-05-20 09:15:26
408
原创 Hadoop 写文件
1.客户端将文件写入本地磁盘的HDFS Client 文件中2. 当临时文件大小达到一个block 大小时,HDFS client 通知NameNode,申请写入文件3. NameNode 在HDFS 的文件系统中创建一个文件,并把该block id和要写入·的DataNode的列表返回给客户端4 客户端收到这些信息后,将临时文件写入DataNodes4.1 客户端将文件内容写入第一个DataNode(一般以4kb 为单位进行传输)4.2 第一个DataNode接收后,将数据写入本地..
2020-05-19 23:52:36
412
原创 Hadoop -HDFS
全称:分布式文件系统‘’Block数据块:1基本存储单元,一般大小为64M(配置大的主要是因为:1) 减少搜寻时间,一般硬盘传输速率比寻道时间要快,大的块可以减少寻道时间;2)减少管理块的数据开销,每个块都需要在NameNode 上有对用的记录;3) 对数据块进行读写,减少建立网络的连接成本。2. 一个大文件会被拆分成一个个的块,然后存储于不同的机器,如果一个文件少于Block 大小,那么实际占用的空间为其文件的大小。3.基本的读写单位,类似于磁盘的页,每次都是读写一个块。4. ..
2020-05-19 18:25:07
184
原创 Hadoop-简介
Hadoop 简介: hadoop 可运行于一般的商用服务器上,具有高容错,高可靠性,高扩展性等特点适合写一次,读多次的场景。适合:大规模数据,流式数据(写一次,读多次),商用硬件(一般硬件)不适合:低延时的数据访问,大量的小文件,频繁修改文件(基本就是写1次)Hadoop 架构:HDFS:分布式文件存储YARN: 分布式资源管理MapReduce: 分布式计算Others:利用YARN 的资源管理功能实现其他的数据处理方式内部各个节点基本都是采用Master-Wor
2020-05-19 16:56:42
195
原创 KNN-kd 树
高维查找结果:B 树: 是查找等于一个点或者一个区间之间有哪些元素KD 树:查找块中二维的点,应用:基于位置的查找kd -树构造: 使用垂直/水平线 把点集递归分割成两部分,在偶数层使用水平线,奇数层使用垂直线,每个叶子为一个点相当于两个二叉树的交叠kd- 树查询: 递归的访问交叉查询的区域报告在树/结点中且在查询中完全包含的点...
2020-03-29 17:57:02
423
原创 算法笔记(40)
1 斐波拉契数列,递归,复杂度2的n次方e二分查找:O(logn)二叉树的遍历:O(n) 每个节点遍历仅遍历一次排序的二维矩阵的查找:O(n)快排:O(nlogn)2 优先队列正常入,按优先级出。实现机制:1) 堆(二叉堆,多项式堆,斐波拉契堆),二叉搜索树。小顶堆:最小的在最上面3 Hashmap:平均时间复杂度:查找,删除,插入复杂度O(1)。最差的时间复...
2019-12-28 16:23:38
130
原创 深度学习-GRU
ref:https://blog.youkuaiyun.com/vivian_ll/article/details/88780661只有两个门:重置门和更新门。把细胞状态和隐藏状态进行了合并,2014年提出,与LSTM 相似,但是更易于计算。其中,rt表示重置门,Zt 表示更新门。重置门决定是否将之间的状态忘记。当rt 趋近于0的时候,前一个时刻的状态信息ht-1会被忘掉,隐藏状态ht会被重置为当...
2019-11-27 14:49:36
783
原创 深度学习-变分自编码器
ref:https://zhuanlan.zhihu.com/p/88750084http://www.atyun.com/17976.htmlhttps://www.spaces.ac.cn/archives/52531 为每个潜在属性表示为可能值的范围。VAE 会生成一个隐空间,从中对点进行采样。VAE的结构:任何自编码器的目标都是重建原始输入。通常,自编码器首先将输入...
2019-11-24 11:17:55
595
R-3.2.2.tar.gz linux 版本
2017-08-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人