
神经网络
文章平均质量分 83
snow5618
梦在远方,路在脚下,初心不忘,方可抵达。
展开
-
知识蒸馏之手写体识别
知识蒸馏本文主要是根据该网站视频(https://www.bilibili.com/video/BV1s7411h7K2?t=906)进行总结,如有理解误差,望批评指点1. 首次提出首次提出:https://arxiv.org/pdf/1503.02531.pdf作者的动机是想找到一个方法,把多个模型的知识提炼给单个模型。虽然现在很多分类模型都采用交叉熵衡量预测值与真实值,然而真实值采用的one-hot向量所能提共的信息没有概率分布多。原理:概率分布比onehot更能提供信息-暗知识。lo原创 2021-04-22 11:56:45 · 511 阅读 · 2 评论 -
Detecting Visual Relationships with Deep Relational Networks
用深度关系网络检测视觉关系物体之间的关系在图像理解中起着重要的作用,以前的研究方法将“关系”作为一个分类问题,每一种关系类型(如:‘骑’)或每个不同的视觉短语(如‘人-骑-马’)作为一个类别。但这种存在缺陷,例如视觉外观多样,视觉短语多样。针对此,本文建立一个综合框架来解决这个问题。框架的核心就是 深度关系网络1. 引言早期将视觉关系视为一个分类任务,考虑将对象和关系谓词的不同组合作为一个类,但是会遇到很多不平衡类,例如视觉基因组中有超过75k不同的视觉短语,每个短语的样本数量从少量到超过10k不等,原创 2020-12-13 18:51:00 · 430 阅读 · 0 评论 -
图卷积网络在文本和视频的关系对齐中的应用
1.写在前面原文来自知网《基于视觉-文本关系对齐的跨模态视频片段检索》这是一篇关于利用文本进行视频片段检索的论文。2.论文要点论文总结了前人研究工作的缺点,并借助图结构在表达关系时的强大能力与图卷积网络的近年发展,,提出了跨模态关系对齐的图卷积框架 CrossGraphAlign,具体就是CrossGraphAlign首先为查询文本和待检索视频分别生成文本关系图和视觉关系图。接着CrossGraphAlign中的视觉-文本关系对齐的图卷积网络试图匹配一段时间内的文本关系图和视觉关系图。最后基于匹配原创 2020-12-13 11:34:08 · 545 阅读 · 0 评论 -
添加自己的参数和网络
1. add networkfrom .net import Netfrom .my_net import MyNetdef factory(engine=None): Logger()('Creating mnist network...') if Options()['model']['network']['name'] == 'net': network = Net() # 要设置好网络的名字 #model: # name: simple #原创 2020-11-08 23:04:35 · 309 阅读 · 0 评论 -
[论文阅读笔记]:LEARNING TO COUNT OBJECTS IN NATURAL IMAGES FOR VISUAL QUESTION ANSWERING
物体计数在VQA任务中的应用摘要Visual Question Answering (VQA) models have struggled with counting objects in natural images so far. We identify a fundamental problem due to soft attention in these models as a cause. To circumvent this problem, we propose a neural net原创 2020-10-22 12:24:33 · 984 阅读 · 1 评论 -
Multi-modality Latent Interaction Network for Visual Question Answering 面向视觉问题回答的多模态潜在交互网络
摘要现有的VQA技术大多是对单个视觉区域和单词之间的关系进行建模,这不足以正确回答问题,从人类角度考虑,回答视觉问题需要理解视觉和问题信息的概要。本文提出MLI模块,能够学习潜在的视觉和语言的概要之间的跨模态关系,该模式将视觉区域和问题汇总为少量的潜在表示,从而避免对单个区域和单词关系进行建模。这种潜在的表示融合了两种模式的有价值的信息,并被用于更新视觉和语言的特征。这个MLI模块可以堆叠多个阶段,以对两种模式之间的复杂和潜在关系进行建模。1.引言在视觉问答技术中,之前的研究涉及:获取更好的图像特征和原创 2020-10-11 11:39:44 · 628 阅读 · 0 评论 -
神经网络的基础知识
前馈神经网络前馈神经网络是最早被提出的神经网络,熟悉的单层感知机,多层感知机,卷积深度网络等都属于前馈神经网络,之所以叫前馈,可能是因为信息向前流:数据从输入–计算–输出步骤。像RNN有反馈连接的叫反馈神经网络。神经元科学家参考了生物神经元的结构,抽象了神经元模型MP,一个神经元模型包含:输入,计算,输出如图:一个典型的神经元模型:包含n个输入,1个输出,计算功能(先求和,再将结果送入f激活函数中) 图中箭头代表连接,每个箭头都会包含一个权值w。一个神经网络的训练算法就是让权重的值调整到最佳,使得整原创 2020-09-12 21:25:20 · 536 阅读 · 0 评论