- 博客(49)
- 资源 (2)
- 收藏
- 关注

原创 基于视频的行人流量密度检测
基于视频的行人流量密度检测1.detection.py:通过已经训练好的Faster-Rcnn参数实现对行人的识别并标记(其中标记行人的阈值为0.7,即识别率必须达到70%);2.camshift2.py:利用mean-shift对已经标记的人进行目标跟踪,中间通过不断迭代更新行人目标位置并实时标记;3.kalmon.py:借助卡尔曼滤波方式来对行人移动位置进行预测,提高目标跟踪的精度;...
2018-12-14 18:15:25
10190
36
原创 Android开发应用笔记
Android开发笔记一、Android基本介绍Android系统四大组件:Activity, 服务, 广播接收器,内容提供程序。Activity是与用户交互的入口点。服务是一个通用入口点,用于因各种原因使应用在后台保持运行状态,用于执行长时间运行的操作或为远程进程执行作业。借助广播接收器组件,系统能够在常规用户流之外向应用传递事件,从而允许应用响应系统范围内的广播通知,广播接收器作为 BroadcastReceiver 的子类实现,并且每条广播都作为 Intent 对象进行传递。内容提供程序管理一
2021-03-26 14:21:32
486
原创 Concerto: 针对于移动实时视频通信的编解码器和传输层协调设计系统
本文出自论文 Learning to Coordinate Video Codec with Transport Protocol for Mobile Video Telephony,设计出一个基于数据驱动的模仿学习算法Concerto,为编解码器和传输层决定最佳协同码率,从而最大化QoE。
2021-03-15 15:47:11
1019
原创 Pytorch网络训练模型转成C++推理执行
显著图推理模型C++转换显著性检测网络模型是基于PyTorch深度学习框架进行搭建并参与训练的,在实际应用和生产中,由于要满足低延迟和严格部署要求,通常选用C++来进行推理过程。这里的显著图推理模型C++转换过程主要由以下几个步骤组成:将PyTorch网络模型转换为Torch Script,并序列化为一个文件;配置编译运行环境,在C++中加载模型参数,完成推理任务。系统环境(Windows)电脑系统版本:Windows 10显卡版本:GeForce RTX 2070(显存8192MB)编译
2020-11-23 11:39:10
3795
原创 Cloud Gaming论文笔记
Cloud Gaming论文笔记1. A Survey on Cloud Gaming: Future of Computer Games云游戏是一种新的方式,在任何地方任何时间为玩家提供高质量的游戏体验。复杂的游戏软件在数据中心的强大服务器上运行,渲染的游戏场景通过网络实现传输给玩家,而玩家使用在不同设备上的轻量级软件与游戏进行交互。由于高速网络和云计算的发展,云游戏的前景也变得更好。在云游戏平台上,主要负责两个功能:(1)将玩家命令转换为游戏内部交互的游戏逻辑;(2)实时生成游戏场景的场景渲染器
2020-11-23 11:31:13
1383
原创 视频编解码概念讲解
视频编解码概念讲解1. 视频编码帧在视频编码序列中,主要有三种编码帧:I帧、P帧、B帧,如下图所示。I帧即Intra-coded picture(帧内编码图像帧),不参考其他图像帧,只利用本帧的信息进行编码P帧即Predictive-codedPicture(预测编码图像帧),利用之前的I帧或P帧,采用运动预测的方式进行帧间预测编码B帧即Bidirectionally-predicted picture(双向预测编码图像帧),提供最高的压缩比,它既需要之前的图 像帧
2020-11-23 11:28:25
1753
原创 视频传输协议的总结区分
视频传输协议的总结区分1. SRT协议(开源视频传输协议)定义: 安全可靠传输协议(Secure Reliable Transport, SRT)是基于UDT的开源互联网传输协议,保留了UDT的核心思想和机制,抗丢包能力强,适用于复杂的网络环境。协议特点: 安全(支持AES加密,保障端到端的视频传输安全),可靠(通过前向纠正技术FEC来保证传输的稳定性),低延迟(建立在UDT协议之上,解决了UDT协议传输延迟高的问题)。SRT协议对上层提供了丰富的拥塞控制统计信息,包括RTT、丢包率、inflight
2020-11-23 11:26:15
2702
原创 Docker学习笔记
Docker学习笔记一、简介:Docker使用客户端-服务器CS架构模式,使用远程API来管理和创建Docker容器,容器通过Docker镜像来创建。其中docker镜像是用于创建容器的模板,docker容器是独立运行的一个或一组应用,是镜像运行时的实体,类似类和对象的关系。Docker和虚拟机的区别:Docker自身特点:二、Docker安装:设置repository:sudo apt-get updatesudo apt-get install \ apt
2020-11-23 11:23:06
126
原创 Makefile学习笔记
在编译大型C++开发项目中,MakeFile接触的比较多,而之前都是简单程序不需要复杂编译,所以没什么太多了解,因此对MakeFile的语法以及规则进行了学习总结,主要参考自《Makefile学习写法》这本书。一、程序的编译和链接首先将源文件编译成中间代码文件,即Object File,称为编译(compile)。然后将大量的Object File合成执行文件,称为链接(link)。由于编译生成的中间目标文件太多,在链接时需要指出中间目标文件名,因此要给中间目标文件打包,称为库文件(windows.
2020-11-23 11:12:04
139
原创 Salsify: 低延迟的网络视频框架设计--视频编解码器和传输协议的紧密集成
本文出自论文Salsify: Low-Latency Network Video through Tighter Integration between a Video Codec and a Transport Protocol,对其论文内容进行了基本总结,这里提出了用于实时视频系统的Salsify,结合了视频编解码器和传输协议中的率控制算法,来避免引发丢包和自身流量的排队延迟。Salsify是一个专门用于实时网络视频的架构,它紧密集成了一个视频编解码器和一个网络传输协议,允许它快速响应变化的网络.
2020-11-23 11:02:09
994
1
原创 Learning in situ: 视频流媒体中真实环境下训练的自适应码率选择算法Fugu
作者提出Fugu算法,通过结合经典控制策略和一个学习网络预测器,并将来自真实部署环境下的数据使用监督学习的方法进行现场训练,从而使自适应码率选择性能更优。
2020-08-03 23:58:16
1922
原创 用于360度视频流的长时间域的视点预测
本文出自论文Very Long Term Field of View Prediction for 360-degree Video Streaming,用于提高360度视频流中的视点预测。本文提出基于两种FoV表示的多个预测模型:一个使用FoV中心轨迹,另一个使用表示FoV中心分布对的等矩阵热度图。在两个流行数据集上的评估证实出所提出的模型可以显著地超越基准模型,另外其他用户的FoVs对...
2020-04-06 20:43:41
1452
原创 基于图像和视频上的显著性目标检测总结
本文主要对SOD领域内的主要模型方法、数据集、评估方法和数据集做了一定的总结报告,部分内容源自于相关论文和网站博客内容。
2020-02-18 14:34:21
6758
原创 PDB-ConvLSTM: 用于视频显著性目标检测的金字塔扩张较深的ConvLSTM网络
本文出自论文Pyramid Dilated Deeper ConvLSTM for Video Salient Object Detection, 主要提出了一个视频显著性目标检测模型,由PDC模块和PDB-ConvLSTM模块组成。本文提出了一个快速的视频显著性目标检测模型,它基于一个新的递归网络架构,被命名为PDB-ConvLSTM。一个金字塔扩张卷积(PDC)模块被首次设计用于在多尺度...
2020-02-11 20:13:51
4081
转载 详解目标检测Faster R-CNN
目标检测的一般结构:背景R-CNN - 是 Faster R-CNN 的启发版本. R-CNN 是采用 Selective Search算法来提取(propose)可能的 RoIs(regions of interest) 区域,然后对每个提取区域采用标准 CNN 进行分类。出现于2015年早期的Fast R-CNN 是 R-CNN 的改进,其采用兴趣区域池化(Region of Inter...
2019-11-19 09:44:32
685
转载 目标检测的各种算法总结
这里是引用腾讯云博客文章:一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD文章目录一、目标检测常见算法二、传统的目标检测算法2.1 从图像识别的任务说起2.2 物体检测(Object Detection)三、候选区域/窗 + 深度学习分类3.1 R-CNN横空出世3.2 SPP Net3.3 Fast R-CNN3.4 Faster R-CNN...
2019-11-17 22:44:41
16728
原创 MetaPruning: 基于元学习的自动化神经网络通道剪枝
我们提出来一个最新的元学习方法,对非常深的神经网络进行自动化通道剪枝。首先训练出一个PruningNet,对于给定目标网络的任何剪枝结构都可以生成权重参数。我们使用一个简单的随机结构采样方法来训练PruningNet,然后应用一个进化过程来搜索性能好的剪枝网络。与当前最先进的剪枝方式相比,MetaPruning在MobileNet V1/V2和ResNet上有着最好的性能表现。
2019-10-28 22:15:09
3159
5
原创 使用边缘计算的深度学习:回顾
本文主要针对于深度学习和边缘计算的交叉进行一个综述,它将提供在网络边缘使用深度学习的应用程序的概述,讨论不同的方法来快速执行跨终端设备、边缘服务器和云结合的深度学习推理,并描述了跨多个边缘设备训练深度学习模型的方法。
2019-09-20 08:48:17
10377
1
原创 AMC:移动设备上模型压缩和加速的AutoML
本文,我们提出了针对模型压缩的AutoML,称为AMC,它利用强化学习方法来有效地采样设计空间,能够提高模型压缩质量。我们在没有人力作用的情况下,以一种完全自动化的方式获得了先进的模型压缩效果。在4倍浮点数计算量减少的情况下,在ImageNet上的VGG-16模型下,我们获得了比手动调整模型压缩方法更好的2.7%精度提升。
2019-08-24 11:01:39
2064
原创 端边云协作推理相关论文总结
Papers About End-Edge-Cloud Collaborative Inference文章目录Papers About End-Edge-Cloud Collaborative InferencePart 1: Edge ComputingPart 2: Model CompressingPart 3: Reinforcement LearningReferencesPar...
2019-08-18 22:20:19
5364
3
原创 Adapt CNNs:用于能量受限的图像分类任务的自适应神经网络设计
我们将自适应CNNs的设计作为一个超参数优化问题,并将运行在移动设备上的能量、精度和通信约束考虑在内。为了有效解决这个问题,我们应用贝叶斯优化到设计空间的性质中,在几十次函数评估中达到接近的最优配置。
2019-08-16 21:41:26
810
原创 NestDNN:用于连续移动视觉的资源感知性多租户设备深度学习框架
本文我们提出了NestDNN,一个将运行时资源的动态性考虑在内的框架,对于移动视觉系统可支持资源感知性多租户的设备深度学习。NestDNN支持每个深度学习模型来提供灵活的资源和精度间的权衡,在运行期间,它动态地为每个深度学习模型选择了最优的资源和精度间的权衡,从而更好地适应系统可用运行资源的需求。
2019-08-15 12:48:04
1048
原创 跨边缘设备和云端的分布式推理
我们提出来一个分布式DNN架构,它可以学习端到端如何表示原始传感数据,并通过网络发送数据,以满足最终的传感任务的需求。这样的设计可以很自然地适应传感器和云之间不同的网络带宽,并自动发送适合任务的数据特征。
2019-08-12 21:41:12
2972
原创 使用强化学习的神经架构搜索
本文中我们引入了神经架构搜索,使用一个递归神经网络来组成神经网络架构的想法。通过使用递归网络作为控制器,我们的方法更具灵活性,从而它可以搜索到可变长度的架构空间。我们的方法在具有挑战性的基准上表现出很强的经验性能,对于自动化寻找好的神经网络架构提供了一个新的研究方向。
2019-08-06 09:56:45
1452
原创 DQN:深度强化学习实现人类层次的控制
我们利用最近在训练深度神经网络方面的相关进展,开发出一种新的人工智能代理,被称为深度Q-network,它可以使用端到端的强化学习,直接从高维度传感输入中学习到成功的策略。
2019-08-05 16:04:07
1783
原创 Channel Pruning:用于加速深度神经网络的通道剪枝方法
我们介绍了一种新的通道剪枝方法,用来加速非常深的卷积神经网络。给定一个训练过的CNN模型,我们提出来一种迭代式的两步骤算法,通过基于通道选择的LASSO回归和最小二乘法重建来有效地修剪每一层。我们进一步将这个算法扩展到多层、多分支的情况。该方法减少了积累误差,提高了与各种体系架构的兼容性。
2019-07-27 20:46:38
5465
1
原创 Deep Compression:使用剪枝算法、权重量化和霍夫曼编码的的深度神经网络压缩
本文出自论文 Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding ,主要引入了三个阶段来对深度神经网络进行压缩,分别是:剪枝、训练量化和霍夫曼编码。为了解决神经网络计算和内存密集型而难以在硬件资源受限的系统上部署的问题,本文引入了深度...
2019-07-26 16:45:03
3772
1
原创 剪枝算法:有效神经网络的权值和连接学习
本文出自论文 Learning both Weights and Connections for Efficient Neural Networks ,主要介绍了剪枝算法的使用以及其压缩效果的性能影响。神经网络是计算密集型和内存密集型的,使得它们在嵌入式系统上部署很困难。另外,卷积网络在训练开始前其体系架构被固定,导致其训练过程不能改进它的体系架构。为了解决这些限制,本文采用了一种方法来减...
2019-07-25 19:00:09
2436
5
原创 实时视频处理的边云协作神经网络
本文出自论文 Collaborative Edge and Cloud Neural Networks for RealTime Video Processing ,主要提出来一个在边缘和云上协作的处理模型(Edge-Cloud Model)。视频流的高效处理在许多新兴的物联网和边缘应用程序中是一个关键的组成,例如虚拟现实(VR)、增强现实(AR)以及自动驾驶汽车。这些应用程序要求实时的高...
2019-07-24 16:21:36
1549
原创 Edge Intelligence:边缘计算与人工智能的结合
本文出自论文 Edge Intelligence: Paving the Last Mile of Artificial Intelligence with Edge Computing ,主要对边缘智能的最新研究成果进行了全面调查,并进行了完善的综述。边缘智能的研究仍处于起步阶段,计算机系统和人工智能社区都迫切需要一个专门的地方来交流边缘智能的最新进展。为了这个目的,本文对边缘智能的最新...
2019-07-23 21:40:50
17715
转载 Auto Machine Learning笔记 - Bayesian Optimization
原文链接:Auto Machine Learning笔记 - Bayesian Optimization优化器是机器学习中很重要的一个环节。当确定损失函数时,你需要一个优化器使损失函数的参数能够快速有效求解成功。优化器很大程度影响计算效率。越来越多的超参数调整是通过自动化方式完成,使用明智的搜索在更短的时间内找到最佳超参组合,无需在初始设置之外进行手动操作。贝叶斯优化(Bayesian ...
2019-07-20 10:22:16
1474
原创 Task Scheduling:Cloud-Edge 协作学习中的传输时间优化任务调度
本文出自论文 Task Scheduling with Optimized Transmission Time in Collaborative Cloud-Edge Learning,主要研究了一个任务调度问题来减少加权传输时间,同时把学习精度考虑在内。深度渗透学习技术在任务关键性应用(如无人驾驶车)需要严格时间的要求来保证它的交互性和大型训练数据来保证它的准确性,这个不可能被云很容易地...
2019-07-19 17:45:07
1703
原创 partition:执行在雾设备上的CNN模型划分
本文出自论文 Partitioning of CNN Models for Execution on Fog Devices ,提出了一种新的针对CNN模型的深度输入划分方案,并通过实验来证明其良好性能。深度神经网络的改进意味着广泛使用这种模型来分析和推理大量数据,包括传感器观察,图像和语音。对于这种在靠近数据源的设备上运行的推理任务的需求正在增长。这样的设备被放置在网络边缘,被称作雾设备...
2019-07-18 15:34:10
761
原创 AdaComp:边缘设备上的分布式深度学习
我们提出了AdaComp,一种新的算法用于压缩workers对服务器模型的更新。这种方法结合了有效的梯度选择和学习率调整,适用于随机梯度下降的方法。我们发现:与标准异步随机梯度下降相比,worker发送到服务器上的数据总量减少了两个数量级,同时又保持了模型的准确性。
2019-07-16 20:36:33
1479
原创 HAQ:硬件感知自动化量化框架
本文出自论文 HAQ: Hardware-Aware Automated Quantization with Mixed Precision,利用强化学习来自动确定量化策略,并在设计过程中对硬件加速器进行反馈。一、简介传统的量化方法对所有层使用相同的比特数,但是当不同的层有着不同的冗余且在硬件平台上表现有差异性时,对不同的层使用灵活的位宽是很有必要的。然而目前所缺少的部分是如何确定不同硬...
2019-07-13 14:51:20
5433
转载 面向深度学习的高效方法与硬件
韩松,2017 年斯坦福大学电子工程系博士毕业,师从 NVIDIA 首席科学家 Bill Dally 教授。他的研究也广泛涉足深度学习和计算机体系结构,他提出的 Deep Compression 模型压缩技术曾获得 ICLR’16 最佳论文,ESE 稀疏神经网络推理引擎获得 FPGA’17 最佳论文,对业界影响深远。他的研究成果在 NVIDIA、Google、Facebook 得到广泛应用,博士期...
2019-07-12 09:42:20
487
原创 Edgent:移动设备与边缘的协同推理
Edgent包含两个关键点:(1)自适应地将DNN计算划分在设备和边缘之间的DNN分区,利用相邻的混合计算资源进行实时的DNN推理;(2)通过在适当的中间DNN层提前退出来加速DNN推理,从而进一步降低计算延迟。
2019-07-11 16:01:04
3208
原创 Neurosurgeon:移动边缘和云端自动划分DNN系统
本文出自于论文Neurosurgeon: Collaborative Intelligence Between the Cloud and Mobile Edge,主要介绍了
2019-07-10 14:35:04
3804
5
原创 深度神经网络中基于提前退出的快速推理方法的研究与实现
BranchyNet_chainer基于提前退出部分样本原理而实现的带分支网络(supported by chainer)摘要 深度神经网络是具有一定复杂程度的神经网络,可以定义为具有输入层、输出层和 至少一个隐藏层之间的网络。每个层在一个过程中执行特定类型的分类和排序,这些复 杂的神经网络的一个关键用途是处理未标记或未结构化的数据。一般来说,随着网络深 度的增大,网络的性能也将会...
2019-07-08 17:09:24
2722
4
MetaPruning-Meta Learning for Automatic Neural Network Channel Pruning.pdf
2019-10-28
TCP-IP详解 三卷全pdf高清晰中文版
2019-03-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人