
Deep Learning
文章平均质量分 80
勤劳的凌菲
Try my best! Do myself~~
展开
-
pytorch模型转为tensorrt engine的通用流程
安装onnxsim库。原创 2023-08-09 10:04:41 · 685 阅读 · 0 评论 -
tensorrt官方int8量化方法汇总
int8量化对小目标检测影响较大;int8量化相比fp16量化推理时间并不会节省一半,需实测;当fp16推理时间满足要求时,请采用fp16量化;原创 2023-08-08 15:38:53 · 1976 阅读 · 3 评论 -
模型与计算平台
说明:部分内容摘自参考文献,如有侵权,联系删除。原创 2023-07-14 13:26:38 · 652 阅读 · 0 评论 -
yolov8检测框过小解决方案
训练集上最大边长:ultralytics/yolo/utils/loss.py(此为8.0.117版本位置,前期版本位置不太一样,找到训练的loss函数即可),在loss函数中加入打印,即以下代码中的print。分析:dfl loss是检测框和真实框比较相近时(即在真实框的某个相近范围内),loss就会很小,个人理解是一种软标签,而我们平时用的box loss是硬标签,此时要加大box loss在loss中的权重。将self.reg_max设置为1,即不采用dfl loss,查看检测框是否正常;原创 2023-07-11 10:47:49 · 3152 阅读 · 0 评论 -
ubuntu cpp工程环境安装与编译
文章目录1. cmake及依赖安装2.cmake-gui安装3. 编译安装opencv3.1 下载opencv源码3.2 解压安装包3.3 cmake-gui设置及编译3.4 终端编译4. cpp IDE安装1. cmake及依赖安装sudo apt install cmakesudo apt install build-essentialsudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavform原创 2021-07-21 17:49:33 · 697 阅读 · 2 评论 -
tensorrt+opencv c++工程编译的问题
opencv编译请点我问题1 CMakeLists.txt的写法cmake_minimum_required(VERSION 3.10)set(CMAKE_CXX_STANDARD 14)set(CMAKE_CXX_STANDARD_REQUIRED TRUE)set(CMAKE_MODULE_PATH "${CMAKE_SOURCE_DIR}" ${CMAKE_MODULE_PATH})set(CMAKE_INCLUDE_CURRENT_DIR ON)set(CMAKE_AUTOMOC O原创 2021-07-21 17:45:43 · 1192 阅读 · 3 评论 -
You Only Look One-level Feature(YOLOF)
paper codeMotivation目标检测中常用到特征金字塔(FPN),在各网络中证明FPN确实有效,通常认为其有效得益于两个方面:(1)多尺度特征融合:融合了多种高分辨率和低分辨率的特征获取到更好的特征表达;(2)分而治之:根据目标的大小在不同层进行目标检测。目标检测的网络结构可以分为三大部分:backbone、encoder、decoder,如下所示:对encoder设计如下结构Figure 1进行实验,验证FPN的有效性是得益于多特征融合还是分而治之通过实验发现SiMo作为enc原创 2021-03-23 16:08:12 · 446 阅读 · 0 评论 -
RealSR算法汇总
RealSRNTIRE2020真实超分双赛道冠军;两阶段:1)自监督数据生成;2)监督SR超分;作者提出一种新的数据制作方案:统计模糊核与真实噪声分布并用于制作训练数据对;可以使得LR与真实世界图像处于同域,进而将提升图像超分的性能;作者提出一种真实世界超分模型以获得更好的感知效果真实世界超分的关键问题在于如何引入精确的降质模型以确保生成的LR图像与原始图像具有同域属性(比如噪声分布、模糊等)在实际场景,HR图像、模糊核和噪声均未知的。为更精确的估计降质模型,我们需要从图像中估计模糊核与噪声。原创 2020-07-30 13:14:12 · 3514 阅读 · 0 评论 -
MuCAN: Multi-Correspondence Aggregation Network for Video Super-Resolution论文笔记
论文链接:https://arxiv.org/abs/2007.11803代码:未公开ECCV2020前言当前VSR算法所存在的问题:1)通常采用光流来建立时间相关性,但是光流估计易有误,从而影响重建结果;2)VSR算法极少采用自然图像中本就存在的相似模式。之前的VSR算法对对齐和回归两个阶段单独建模,本文将VSR看作帧内和帧间集成任务。本文所依据的现象:连续帧具有相似内容;同一帧内不同位置具有相似内容。帧间相关性:为了验证作者的想法,实验设置:在MPI-Sintel Flow数据集上,用一.原创 2020-07-28 13:42:07 · 1252 阅读 · 1 评论 -
图像超分辨率论文笔记
Real-World Super-Resolution via Kernel Estimation and Noise Injection论文链接:http://openaccess.thecvf.com/content_CVPRW_2020/papers/w31/Ji_RealWorld_SuperResolution_via_Kernel_Estimation_and_Noise_Injection_CVPRW_2020_paper.pdf代码:RealSRCVPR2020, NTIRE2020原创 2020-06-18 11:33:34 · 1525 阅读 · 0 评论 -
视频超分辨率论文笔记
持续更新Deep SR-ITM: Joint Learning of Super-Resolution and Inverse Tone-Mapping for 4K UHD HDR Applications论文连接:https://arxiv.org/ftp/arxiv/papers/1904/1904.11176.pdf代码:https://github.com/sooyekim/Deep-SR-ITM (matlab)CVPR 2019 oral网络结构:初始图像分解为base l原创 2020-06-15 18:28:42 · 2575 阅读 · 0 评论 -
行人检测几篇论文相关笔记
这部分内容会持续更新,比较难的论文会单独开篇博文讲解,相对比较简单的就只写概要记录在此篇博文中。PedHunter: Occlusion Robust Pedestrian Detector in Crowded Scenes链接:https://arxiv.org/abs/1909.06826代码:https://github.com/ChiCheng123/PedHunter(...原创 2020-01-17 11:51:03 · 793 阅读 · 2 评论 -
CUDA ERROR: device-side assert triggered问题解决思路
这个问题很可能是代码有问题,先排查错误step1在environment variable中添加:CUDA_LAUNCH_BLOCKING=1这样更容易定位到出现问题的地方step2再排查报错附近的原因,就在报错附近。我今天处理NLP,出现该问题的原因是:词的索引> embedding层词量...原创 2020-01-10 16:06:57 · 11952 阅读 · 3 评论 -
ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs论文解读
发表时间:2015论文链接:https://arxiv.org/pdf/1512.05193.pdf开源代码:https://github.com/galsang/ABCNN (tensorflow) https://github.com/lsrock1/abcnn_pytorch (pytorch)代码语言:python适用: Answer Slection(AS) paraphra...原创 2019-11-26 15:15:44 · 811 阅读 · 0 评论 -
关于loss不收敛的一些建议
之前训练网络时,会先编写学习率随训练epoch的增加而逐渐减低的函数,然后选取一个相对较大的学习率(一般从e-2量级开始),选取一个epoch能够接受的batchsize,如果loss稳定下降较快,则开始训练.从未体验过学习率和batchsize搭配之难.最近新看了一篇论文ABCNN(有空再细讲),采用开源的tensorflow工程训练一下,效果很好,因工程需要,开始将其移植到pytorch...原创 2019-11-20 10:45:16 · 10031 阅读 · 9 评论 -
Tencent_AILab_ChineseEmbedding.txt使用
正在做问答系统,看到腾讯正式开源一个大规模、高质量的中文词向量数据集Tencent_AILab_ChineseEmbedding.txt,简直喜极而泣。下载地址:https://ai.tencent.com/ailab/nlp/embedding.html ,里边有对数据集的介绍还有论文的下载地址。迅速写了一个代码,用在我自己的问答系统中,效果嘛还在训练,初始几步的loss确实比之前随机初始化下...原创 2018-10-19 16:21:20 · 7956 阅读 · 10 评论 -
记忆网络Memory Network
今天看的文章主要涉及记忆网络,其他并无新意,所以就懒得自己写了,直接转载容易理解的博文。作者:北邮张博 来源:优快云 原文:https://blog.youkuaiyun.com/irving_zhang/article/details/79094416?utm_source=copy 在本专栏的第一篇文章对话系统综述中提到,seq2seq中的记忆依靠rnnCell或者lstmCell实现,但是...转载 2018-10-15 11:41:29 · 1100 阅读 · 0 评论 -
对话语料库
用于训练中英文对话系统的语料库 Datasets for Training Chatbot System用于对话系统的中英文语料 本项目收集了一些从网络中找到的用于训练中文(英文)聊天机器人的对话语料 公开语料搜集到的一些数据集如下,点击链接可以进入原始地址dgk_shooter_min.conv.zip 中文电影对白语料,噪音比较大,许多对白问答关系没有对应好The NUS S...转载 2018-10-09 09:39:55 · 1506 阅读 · 0 评论 -
AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine论文笔记
摘要阿里小蜜是开放域的问答系统,是检索式问答系统和生成式问答系统的结合体。框架直接上流程图,比较清晰用户输入一个问题q,先采用IR(Information Retrieval)模型检索出一些数据库中的QA对作为候选,然后采用attentive Seq2Seq模型对上述检索出的候选答案进行重新排序,如果排名第一的候选答案的得分高于某个阈值,将此答案作为标准答案输出,否则输出基于a...原创 2018-09-30 10:40:53 · 863 阅读 · 0 评论 -
A robust self-learning method for fully unsupervised cross-lingual mappings of word embeddings论文笔记
回看前几篇笔记发现我剪贴的公式显示很乱,虽然编辑时调整过了,但是不知道为什么显示的和编辑时的不一样,为方便大家的阅读,我开始尝试着采用markdown的形式写笔记,前几篇有时间的话再修改。这篇论文阅读完,我依然有很多不懂的地方,对其操作不是很清晰,因为我没做过这方面的内容,且近期估计没时间学习其项目,所以记录理解的可能有误,希望大家带着思考阅读。PS:感觉这篇文章的作者是这个方向的大神呢,引...原创 2018-10-16 11:39:29 · 1314 阅读 · 1 评论 -
Lingke: A Fine-grained Multi-turn Chatbot for Customer Service
最近做问答系统领域,要求自己每天读一篇论文,为帮助自己理解和记忆,将要点记录在博客上 摘要机器人类型:信息检索型机器人(给一段资料回答问题) 特色功能:1)基于给定的产品说明书回答问题;2)能够应对多轮对话方案流程 ...原创 2018-10-10 08:51:42 · 454 阅读 · 0 评论 -
Question Retrieval with Distributed Representations and Participant Reputation in Community QA论文笔记
原文下载地址摘要社区问题的难点在于:重复性问题 解决上述问题要采用Query retrieval(QR),QR的难点在于:同义词汇 本文算法:1)采用continuous bag-of-words(CBoW)模型对词(word)进行 Distributed Representations(分布式表达,词嵌入);2)对given query和存档的query计算tile域和descrip...原创 2018-10-10 10:17:35 · 370 阅读 · 0 评论 -
Gated Self-Matching Networks for Reading Comprehension and Question Answering论文笔记
原文下载链接摘要检索式问答系统试图从文档中获取问题的答案。一般步骤是先从一众文档中检索相关文档,然后再进一步检索文档回答问题。本文解决的是后一步,即阅读理解式的问答系统。文章基于端到端的多层神经网络模型从篇章中获取答案。模型分为四部分:一是使用多层双向神经网络编码问题和篇章的语义向量表示;二是使用门注意力机制得到问题感知的篇章的语义向量表示;三是通过 Self-Matching 注意力...原创 2018-10-12 15:07:18 · 969 阅读 · 0 评论 -
自然语言处理中的自注意力机制(Self-attention Mechanism)
转自:https://www.cnblogs.com/robert-dlut/p/8638283.html近年来,注意力(Attention)机制被广泛应用到基于深度学习的自然语言处理(NLP)各个任务中,之前我对早期注意力机制进行过一些学习总结(可见http://www.cnblogs.com/robert-dlut/p/5952032.html)。随着注意力机制的深入研究,各式各样的att...转载 2018-09-21 09:50:02 · 2147 阅读 · 0 评论 -
语音问答系统调研
因工作需要,准备开始做语音问答系统,之前对语音和自然语言处理(NLP)没接触过,所以开头还是很难的,历时两周做了一个大概的了解,适合像我这样的新手入门,里边借鉴了n多大神的内容,并给出了讲得比较好的网页、课程等等,如侵权请联系删除。。。一 对话系统框架二 调研内容语音识别-- Speech Recogniton, SR 闲聊型问答系统--Chitchat-bot 知识库...原创 2018-09-14 13:36:41 · 2386 阅读 · 1 评论 -
自然语言处理之Bag-of-words,TF-IDF模型
转自:https://blog.youkuaiyun.com/m0_37744293/article/details/78881231Bag-of-words,TF-IDF模型Bag-of-words model (BoW model)忽略文本的语法和语序,用一组无序的单词(words)来表达一段文字或一个文档,近年来BoW 模型被广泛应用于计算机视觉中,与应用于文本的BoW 类比,图像的特征(fea...转载 2018-09-13 15:02:31 · 675 阅读 · 0 评论 -
seq2seq中的beam search
因工作需要,最近在疯狂补充 自然语言处理和语音识别的知识,内容多为转载,转的内容使我这个小白比较容易理解,大牛可以忽略。。。。转自:https://www.sohu.com/a/159397046_206784首先说明在sequence2sequence模型中,beam search的方法只用在测试的情况,因为在训练过程中,每一个decoder的输出是有正确答案的,也就不需要beam se...转载 2018-08-29 09:43:11 · 2242 阅读 · 0 评论 -
seq2seq模型
转自:https://blog.youkuaiyun.com/gzmfxy/article/details/78691048对于一些自然语言处理任务,比如聊天机器人,机器翻译,自动文摘等,传统的方法都是从候选集中选出答案,这对素材的完善程度要求很高,随着最近几年深度学习的兴起,国外学者将深度学习技术应用与自然语言的生成和自然语言的理解的方面的研究,并取得了一些突破性的成果,比如,Sequence-to-s...转载 2018-08-29 09:27:36 · 857 阅读 · 0 评论 -
梯度爆炸的解决方法: clip gradient
转自:https://blog.youkuaiyun.com/u010814042/article/details/761543911.梯度爆炸的影响在一个只有一个隐藏节点的网络中,损失函数和权值w偏置b构成error surface,其中有一堵墙,如下所示 损失函数每次迭代都是每次一小步,但是当遇到这堵墙时,在墙上的某点计算梯度,梯度会瞬间增大,指向某处不理想的位置。如果我们使用缩放,可以...转载 2018-08-29 08:59:32 · 1031 阅读 · 0 评论 -
ResNeXt算法详解
转自:https://blog.youkuaiyun.com/u014380165/article/details/71667916 论文:Aggregated Residual Transformations for Deep Neural Networks论文链接:https://arxiv.org/abs/1611.05431PyTorch代码:https://github.com/mi...转载 2018-08-28 14:33:48 · 573 阅读 · 0 评论 -
Rasa_NLU及Rasa_NLU_Chi本地代码调试
前言自然语言理解(NLU)是任务型对话系统等更高级应用的基石,基本的NLU工具,包括实体识别和意图识别两个任务。已有的NLU工具,大多是以服务的方式,通过调用远程http的restful API来对目标语句进行解析完成上述两个任务。对于对数据比较敏感的用户来讲,开源项目Rasa_NLU可以本地部署,也可以针对实际需求训练和调整模型。Rasa_NLU只支持英语和德语两种语言,中文因为其特殊性需...原创 2018-11-16 17:42:48 · 3008 阅读 · 6 评论 -
Enhanced Network Embeddings via Exploiting Edge Labels笔记
因为要做KBQA,最近会看一些知识图谱相关的论文,这篇论文是network embeddings类看的第一篇,理解难免有误,望大佬指正。原文链接:https://arxiv.org/abs/1809.05124?context=physics.soc-ph摘要Network Embedding 的工作就是学习得到低维度的向量来表示网络中的结点,低维度的向量包含了结点之间边的复杂信息。...原创 2018-12-21 11:27:31 · 563 阅读 · 0 评论 -
Utterance-level Aggregation For Speaker Recognition In The Wild笔记
论文链接:https://arxiv.org/abs/1902.10107v1开源代码:http://www.robots.ox.ac.uk/~vgg/research/speakerID/网络结构主干网络:Thin-ResNet,提取frame-level特征NetVLAD或GhostVLAD层:将frame-level的特征转换成utterance-level特征。大多数算法是采用...原创 2019-04-04 09:01:34 · 1367 阅读 · 0 评论 -
TensorFlow插曲--tf.argmax函数
转自:http://blog.youkuaiyun.com/zj360202/article/details/70259999tf.argmax(input, axis=None, name=None, dimension=None)此函数是对矩阵按行或列计算最大值参数input:输入Tensoraxis:0表示按列,1表示按行name:名称dimension:和axis功转载 2017-07-28 18:03:59 · 390 阅读 · 0 评论 -
FreeAnchor: Learning to Match Anchors for Visual Object Detection论文详解
问题在基于anchor的目标检测算法中,训练时,通常通过anchor和真实object 框之间的IoU来决定该anchor是否用来预测object (包括类别和位置),通常IoU超过某一阈值则认为该anchor为正例(即作为预测object ),小于某一阈值则认为该anchor为背景。本文的思想就是通过修改loss函数去除人工参与指定anchor的过程,使网络能够自主学习选择哪个anchor和真...原创 2019-09-18 20:16:57 · 1452 阅读 · 2 评论 -
Task-oriented Dialogue System for Automatic Diagnosis论文笔记
发表时间:2018论文链接:https://www.aclweb.org/anthology/P18-2033代码:https://github.com/LiuQL2/MedicalChatbot代码语言:python摘要本文构建了一个用于自动诊断的对话系统。首先,从线上医学论坛上病人的自述以及病人医生间的交谈中提取症状,从而构建数据集;然后,本文提出了用于自动诊断的任务型对话系统框...原创 2019-09-05 11:31:01 · 1330 阅读 · 0 评论 -
Convolutional Neural Network Architectures for Matching Natural Language Sentences论文笔记
发表时间:2015年论文链接:https://arxiv.org/abs/1503.03244v1代码链接:http://nlp.stanford.edu/˜socherr/classifyParaphrases.zip代码语言:matlab摘要较好的匹配算法能够同时为句子内部结构和句子间的交互信息建模。本文提出的模型通过逐层构图和合并充分表达句子的层次信息,而且能够在不同的层次捕捉...原创 2019-09-04 14:10:10 · 1300 阅读 · 0 评论 -
rnn梯度弥散 LSTM无梯度弥散
之前看过,现在突然想不起,真的是好记性不如烂笔头,希望大家在看的时候能够拿笔和纸跟着推导一遍,加深理解。转自:https://zhuanlan.zhihu.com/p/28687529 https://zhuanlan.zhihu.com/p/287494441.RNN梯度弥散和爆炸的原因经典的RNN结构如下图所示:假设我们的时间序列只有三段, S0S_0S0为给定值,神经元没有...转载 2019-08-02 15:51:15 · 351 阅读 · 1 评论 -
few-shot learning几篇论文
Prototypical Networks for Few-shot Learning论文链接:https://arxiv.org/abs/1703.05175开源代码:https://github.com/jakesnell/prototypical-networks发表时间:2017年6月该论文属于metric_based论文中心思想:经过神经网络学会一个映射,将所有样本映射到同一...原创 2019-05-23 10:46:04 · 2370 阅读 · 0 评论 -
Learning to Compare: Relation Network for Few-Shot Learning论文笔记
前言在语音问答系统领域,很多时候,每一个类所拥有的训练数据量是很少的,采用传统的分类器进行训练,很可能出现overfitting,为了应对这种问题,最近要研究一下小样本学习。关于小样本学习的基本概念,可以参看https://www.chainnews.com/articles/650132977783.htm,该综述中还提到了每种类型算法中的典型算法。论文评价论文链接:https://ar...原创 2019-05-22 13:37:44 · 2082 阅读 · 6 评论