计算机视觉
文章平均质量分 78
cubeFUN
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Projects】Facebook开源Blender! 浅谈ParlAI中的Chit-chat任务【一】
此项目链接为ParlAI Projects主页,列出了基于ParlAI框架实现的各类projects。本篇文章则主要介绍Chit-chat任务中,基于ParlAI的模型表现,以及使用方法。QuickStartRequirementspython 3.6torchtextStepsclonegit clone https://github.com/facebookresearc...原创 2020-05-06 20:57:37 · 1318 阅读 · 0 评论 -
【PaperNotes】视频分类【二】监督式端到端CNN系列
(1) 监督学习方法i. 基于图像的视频分类:将视频片段视为视频帧的集合,每个视频帧的特征通过ImageNet数据集上预先训练的最高水平的深度模型(如AlexNet,VGGNet,GoogLeNet,ResNet)进行获取。最终,帧层特征汇聚为视频层特征,作为标准分类器(如SVM)识别的输入。ii. 端到端的CNN网络:关注于利用CNN模型学习视频隐含的时空模式,如3D CNN,Two-str...原创 2020-05-06 11:32:24 · 589 阅读 · 0 评论 -
【PaperNotes】视频分类【一】
Appearance-and-Relation Networks for Video Classification简介提出ARTNet,学习端到端的视频表征ARTNets是由多个SMART blocks堆叠而来的,SMART可用于同时从RGB输入中建模出appearance与relationSMART将spatiotemporal学习分为两部分:用于空间建模的appearance分支与用...原创 2020-05-02 01:32:06 · 688 阅读 · 0 评论 -
【PaperNotes】时间交错网络Temporal Interlacing Network
论文链接相关知识点Temporal Models时间模型依赖于时间相关的状态与sensor变量如下:Xt:时间t下的不可直接观测状态集合Et:时间t下的可观测的迹象变量Markov假设: Xt依赖于X0:t-1的有限子集First-order Markov过程: P(Xt|X0:t-1) = P(Xt|Xt-1)Second-order Markov过程:P(Xt|X0:t-1) ...原创 2020-04-30 22:52:43 · 1991 阅读 · 0 评论 -
SimpleDet安装使用流程教学
SimpleDet安装使用流程教学SimpleDet简介mxnext安装SimpleDet简介A Simple and Versatile Framework for Object Detection and Instance Recognitionsimpledet github仓库地址mxnext安装setup mxnext, a wrapper of mxnet symbol...原创 2019-02-18 12:28:40 · 1579 阅读 · 7 评论 -
SNIPER 获取固定参数并创建模块
Get list of fixed parameters sym_inst = eval('{}.{}'.format(config.symbol, config.symbol))(n_proposals=400, momentum=args.momentum) sym = sym_inst.get_symbol_rcnn(config) fixed_param_names...原创 2019-01-25 16:40:08 · 372 阅读 · 0 评论 -
计算机视觉初学者必知名词与概念Terms & Concepts for beginners in Computer Vision
25个深度学习初学者必知词汇与概念作为一个CV领域的初学者,看论文时常对一些术语不熟悉或者理解不深刻,这里记录一些阅读论文过程中的terms & concepts,加深记忆weight-sharing 共享权重 : use fixed weights for the filter across the entire input反向传播中的weight-sharingupdating...原创 2019-01-09 20:07:59 · 313 阅读 · 0 评论 -
SNIPER MNIterator代码解析
main_train.py train_iter = MNIteratorE2E(roidb=roidb, config=config, batch_size=batch_size, nGPUs=nGPUs, threads=config.TRAIN.NUM_THREAD, pad_rois_to=400)SNIPER/lib/iteratorsMNIteratorE2Eclass...原创 2019-01-25 15:51:32 · 653 阅读 · 0 评论 -
SNIPER/lib/data_utils load_data加载数据
def load_gt_roidb(dataset_name, image_set_name, root_path, dataset_path, result_path=None, flip=False):def load_proposal_roidb(dataset_name, image_set_name, root_path, dataset_path, result_path=N...原创 2019-01-24 17:37:58 · 935 阅读 · 0 评论 -
Efficient Multi-Scale Training训练代码解析
Efficient Multi-Scale Training训练代码解析def parser() 使用argparse模块实现命令行解析[1]导入argparse模块创建解析器对象ArgumentParser,可添加参数add_argument(),指定程序需要接受的命令参数add_argument()定位参数(必选):parser.add_argument(“echo”, h...原创 2019-01-24 15:34:00 · 1113 阅读 · 0 评论 -
转换为COCO数据格式代码
COCO数据格式是许多框架与网络结构通用的数据格式,这里给出一般标注的图片数据格式转换为COCO的数据格式,存储为json文件。存储主干部分dataset = { 'info': { 'description': "This is stable 1.0 version of the 2014 MS COCO dataset.", 'url': ...原创 2019-01-24 14:53:14 · 2478 阅读 · 0 评论 -
SNIPER实践于自动驾驶企业项目-实时障碍物检测
原论文 https://arxiv.org/abs/1805.09300项目地址 https://github.com/cubeFUN/Driving-Automationupdate…原创 2019-01-08 14:48:02 · 791 阅读 · 0 评论 -
CHAPTER1 Geometric Camera Models未完成
Geometric Camera Models1.1 Image Formation1.1.1 Pinhole Perspective1.1.2 Weak Perspective1.1.3 Cameras with Lenses1.1.4 The Human Eye1.2 Intrinsic and Extrinsic Parameters1.2.1 Rigid Transforma...原创 2019-01-23 21:22:00 · 454 阅读 · 0 评论 -
CMU最新视觉特征自监督学习模型——TextTopicNet
CMU最新视觉特征自监督学习模型——TextTopicNet原创: 专注技术分享的 人工智能头条 今天作者 | Yash Patel,Lluis Gomez,Raul Gomez,Marcal Rusinol,Dimosthenis Karatzas, C.V. Jawahar 译者 | 林椿眄 编辑 | Jane 出品 | 人工智能头条▌摘要深度学习方法在计算机视觉领域...转载 2018-07-30 00:08:50 · 1390 阅读 · 0 评论
分享