自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(77)
  • 收藏
  • 关注

原创 A Survey on VQA: Datasets and Approaches

VQA数据集,评估方法,模型和应用的综述

2022-09-14 20:35:34 2616

转载 图像基本知识及常用网络

以下是我自己总结的,还有不足的地方。正在不断修改和完善。推荐一个总结得更好的链接:概览主要语义分割网络,FCN、UNet、SegNet、DeepLab 等概览主要语义分割网络图像基本组成像素 pixel灰度值 intensity (一个pixel的最基本特征)一张image可以看做一个矩阵,矩阵的每一个元素就是一个像素,每个元素上的值就是灰度值图像处理中常见的任务1. 图像分类给定一张输入图像,图像分类的任务是判断该图像属于哪类,如果是多任务分类,可以用于分类该图像包含哪个类别。所以

2021-09-25 21:51:23 755

转载 SCI投稿后不同状态详解

1、Submitted to Journal:稿件上传结束后,会显示稿件状态为submitted to journal,该状态是自然形成的,无需处理。2、Manuscript Received by Editorial Office:稿件已到编辑处,表明投稿成功。如果投稿不符合标准,会返回,然后告诉哪里有问题。3、With Editor:如果投稿时未选择编辑,就会先到主编处,主编分配给其他编辑。此状态表示稿件在主编处,等待分配编辑处理。4、Awaiting Editor Assignment:表示指派

2021-04-24 15:37:17 13773

原创 表情识别任务的复现 for 毕设

表情识别任务的复现 for 毕设

2025-02-15 15:22:18 201

原创 论文阅读:Arabic Dialect Identification with a Few Labeled Examples Using Generative Adversarial Networks

我们扩展了基于Transformer的模型(ARBERT和MARBERT)使用 半监督生成对抗网络(SS-GAN)在生成对抗设置中使用未分类数据。我们的模型能够为阿拉伯语方言样本 生成高质量的嵌入,并帮助模型更好地泛化下游分类任务。

2023-05-16 19:49:40 525 1

原创 论文阅读:Multimodal Graph Transformer for Multimodal Question Answering

在这项工作中,我们的目标是从这两个世界中受益,并提出了一种新的多模态图转换器,用于需要跨多模态执行推理的问答任务。我们引入了一种涉及图形的即插即用类注意机制,将从文本和视觉数据中获得的多模态图形信息作为有效的先验信息整合到vanilla自注意力中。具体来说,我们构建文本图、密集区域图和语义图来生成邻接矩阵,然后将它们与输入的视觉和语言特征组合在一起进行下游推理。

2023-05-14 19:33:58 2239 7

原创 CLIP论文拜读及理解

prompt learning :提示学习

2023-04-17 20:38:52 1232

原创 VQA 2.0数据集的学习和使用过程

该文章记录本人第一次对VQA 2.0数据集进行研究的全过程。某博主的指点,帮了我不少。非常感激!VQA任务就是给定一张图片和一个问题,模型要根据给定的输入来进行回答。很明显,VQA任务的输入有两个(image和question),对于如何提取image的feature,这里就不在赘述, 可以使用CNN提取特征的方式,CNN可以选择Resnet、VGG等骨干网络(去除pooling和fc层)。对于如何提取question的特征,一般的做法是,由于question本身是文字,需要转换为对应的向量形式。

2023-03-31 13:06:24 8259 1

原创 论文阅读:chain of thought Prompting elicits reasoning in large language models

预训练大型语言模型(LLMs)被广泛应用于自然语言处理(NLP)的许多子领域,通常被称为具有特定任务示例的优秀少数镜头学习者。值得注意的是,最近的一种通过逐步回答示例来引出复杂的多步推理的技术——思维链(CoT)提示,在算术和符号推理方面取得了最先进的表现,这些困难的系统-2任务不遵循LLMs的标准比例定律。虽然这些成功通常归因于llm的少次学习能力,但我们通过在每个答案之前添加“让我们一步一步地思考”来证明llm是出色的zero-shot推理者。

2023-03-17 19:44:28 870 1

原创 写好一篇论文的几个“五项原则”

修改稿件时应先从整体上开始,看内容是否完整,思路和段落是否合理,逻辑是否正确,每个句子是否通顺,句子之间是否有合理的连接,用字、标点符号的使用、文献索引是否准确等。“一个核心”是至关重要的,笔者审稿时读过很多论文,每当我觉得终于明白作者想要表达什么时,作者突然笔锋一转,又去聊别的了,读完全文,完全不知道作者的核心观点是什么。好的论文都是具有故事性的,一篇论文就是一个故事,把这个故事讲好,一篇论文就大功告成了。主要是查证自己的科研成果是否解决了一个文献上没有解决的问题,是否往前又走了一步,特殊的意义在哪里?

2023-02-16 21:03:09 864

原创 基于感知动作循环的层次推理用于视觉问答

基于感知动作循环的分层推理框架( HIPA )来处理VQA任务。它将多模态的推理过程与感知动作循环PAC)相融合,解释了人类对周围世界的学习机制。它通过推理的三个阶段来理解视觉模态:对象层面的注意力、组织和解释。它通过词汇层面的注意力、解释和条件化来理解语言情态。随后,视觉和语言模式在整个框架中以循环和分层的方式相互依赖地解释。为了进一步评估视觉和语言特征,我们认为相同答案的图像-问题对最终应该具有相似的视觉和语言特征。因此,我们使用余弦相似度的标准差和曼哈顿距离等指标进行视觉和语言特征评估实验。

2023-02-16 20:45:26 710

原创 基于深度生成学习的中医电子病历自动诊断

基于深度生成学习的中医电子病历自动诊断Deep Generative Learning for Automated EHR Diagnosis of Traditional Chinese Medicine利用无监督深度学习模型,学习特征表示。利用监督学习模型,对DBN进行学习。两个数据集:一种是医学专家索引的纯文本数据集。另一个是原发性高血压的结构化数据集。摘要背景计算机辅助医疗决策(CAMDM)是利用大量电子病历electronic medicalrecords (EMR)数据作为

2023-02-14 16:01:09 605

原创 机器学习在预测脊髓型颈椎病中的应用:一项28名参与者的事后初步研究

机器学习在预测脊髓型颈椎病中的应用:一项28名参与者的事后初步研究Machine Learning for the Prediction of Cervical Spondylotic Myelopathy: A Post Hoc Pilot Study of 28 Participants简单说:训练了两个模型:1)预测脊髓型颈椎病诊断(分类);2)预测CSM严重程度(输出是线性的)。摘要方法:共14例脊髓型颈椎病患者和14例对照组接受颈椎影像学检查。训练了两种不同的人工神经网络模型;1)预测脊髓

2023-02-14 15:59:59 507

原创 计算机断层扫描结肠镜和全自动骨密度仪在一次检查中的可行性

计算机断层扫描结肠镜和全自动骨密度仪在一次检查中的可行性Feasibility of Simultaneous Computed Tomographic Colonography and Fully Automated Bone Mineral Densitometry in a Single Examination简单总结:数据:患者的结肠镜检查和腹部CT检查—————————————————————————————————目的:为了探讨利用全自动软件从计算机断层扫描(CTC)中计算骨密度(BM

2023-02-14 15:59:01 332

原创 PermissionError: [Errno 13] Permissi

代码问题记录

2022-11-21 21:11:02 1366

原创 艺术VQA的数据集与基线baselines

艺术VQA的数据集与基线baselines

2022-09-17 20:38:04 596

原创 用于文化遗产的VQA(基于ArtPedia数据集)

用于文化遗产的VQA(基于VQA v2,OK-VQA,ArtPedia数据集)

2022-09-17 15:18:20 1340

原创 医学视VQA——综述

医学视VQA——综述

2022-09-16 19:51:27 3697 1

原创 视觉答题的方法、数据集和评价指标综述

视觉答题的方法、数据集和评价指标综述

2022-09-16 16:30:42 6108

原创 VQA的应用(调研)

近期又有两个数据集VQA-RAD presented in Lau et al. (2018), and PathVQA described in He et al. (2020),他们提高了VQA训练和测试样本的多样性。广告和图像理解是密切相关的。最后还有利用VQA来做广告设计的,Zhou et al. (2020)提出了一种能够提取文本和图像相关信息的方法,并生成一个新的广告,他使用的是跨模态编码器(cross-modality encoder architecture)。比如多源VQA数据的融合;

2022-09-12 16:02:59 1121

原创 初学nii格式文件

文章目录一、初学nii格式文件二、查看、读取和显示nii.gz文件一、初学nii格式文件参考链接:nii格式和nii.gz格式详解二、查看、读取和显示nii.gz文件参考链接1:【数据处理】nii文件解析参考链接2:查看和显示nii.gz文件...

2022-04-14 12:58:14 1095

转载 医疗人工智能前景——医学影像

作者:Arya:医学图像AI(博士)在读,研究方向为unsupervised deep learning; multi-modal; PET-CT. 写这篇文章梳理一下学习思路,也希望可以给刚开始进入这个行业的朋友一个quick guide。从科研来看,深度学习在医学图像分割的传统应用上,如分割、配准等已经有疲软之势,基本都是用U-Net糅合来去。MICCAI是医学图像领域顶级会议,从MICCAI 2019来看,大部分paper还是用U-Net/FCN的各种改变版本,或者加个GAN。而比较有新意的工作则出

2022-01-13 16:13:53 670

原创 2021年12月22日 笔记

2021年12月22日笔记别人问问题时,回答要有逻辑,要全面(不能让别人不停地问,问很多次,才得到想要的信息和回答)清楚别人问问题的意图:[1].了解某些信息这种情况就需要把信息描述得清楚、全面、明白一些。[2].提出某些疑惑这种情况需要为提问者详细地回答,以解除他的以后或者怀疑。[3].对某些话题,事情感到好奇这种情况需要更加绘声绘色地讲述这个话题。留下好的印象,加强提问者的某些心理(例如信心,崇拜等等)说话要有自信(自信不是骄傲的意思,而是对自己做的研究有足够的自信,对自己的方向

2021-12-26 13:58:21 113

原创 如何调研&如何写调研报告

文章目录怎样才能写一手漂亮的调研报告?一、调研的重要性:二、调研的核心要点三、调研的种类四、调研的选题五、怎样撰写调研报告六、确定调研的大纲七、调研报告的内容是什么为什么怎么办八、小窍门怎样才能写一手漂亮的调研报告?一、调研的重要性:是搞好调研得能深入基层,能与基层打成一片,不然,即使你去基层调研,你也听不到看不到实际情况,都是给你作秀看的,没用。搞好调研得有发现问题、总结规律的能力,从现象看到本质,挖掘其中蕴含的特点。搞好调研还得有一定的文笔功底,第一手资料都摸上来了,但写不出来,归纳不..

2021-12-15 21:36:13 1032

原创 数据集的收集与整理

1. 南京理工大学 陈强教授团队发布的OCTA图像数据集 OCTA-5002. 上海交通大学(倪冰冰团队)发布的 MedMNIST数据集

2021-12-03 19:31:09 3571

原创 如何构思 产品形态

首先,什么是产品形态?或者说在产品的形态设计阶段,我们到底要确定什么内容?其实在这个阶段,就是要明确为了达成产品目标,最重点要做好的几件事。拿到需求的时候,除了花费30%的精力对产品定位做前置思考,你还需要投入至少20%的精力来进行产品形态的确定,输出这个需求的产品框架来。产品形态的设计,是一个不断地运用用户思维和业务思维去思考的过程。关于具体的产品形态设计,可以给大家举几个例子。例如SNS类型的产品,对于这类产品的产品形态设计,最重要的就是想清楚三件事:profile、relation、conten

2021-11-23 10:50:42 768

原创 机器学习在脊柱的应用现状:从临床的观点

Current Applications of Machine Learning in Spine: From Clinical View机器学习在脊柱的应用现状:从临床观点————————————————————————————————————————————————————————————————————————摘要目的:综述机器学习(ML)在脊柱领域的应用现状。方法:我们对2006年至2020年发表的同行评审文章进行了全面的PubMed检索,使用术语(脊柱、脊柱、腰椎、颈椎、胸椎、机器学习

2021-11-17 18:34:26 2419

原创 机器学习算法在退行性颈椎和腰椎疾病中的应用:一项系统综述

Utility of machine learning algorithms in degenerative cervical and lumbar spine disease: a systematic review机器学习算法在退行性颈椎和腰椎疾病中的应用:一项系统综述————————————————————————————————————————————————————————————————————————摘要本研究旨在探讨机器学习在颈椎和腰椎退行性疾病中的应用现状。采用系统评价和荟萃分

2021-11-16 21:22:51 1642

原创 博士生的进展汇报

速度,成果,和努力程度(至少得展示其中2个内容)速度:工作量。读了几篇paper,跑几组实验,写了几行代码,周末和节假日也在加班加点。成果:有用的结果和结论。努力程度:解释清楚这周的每一个细节,哪怕是弯路,并提出经过思考后的下一周计划。范本:“为了达到xxx的目的,我先xxx,然后xxx,最后xxx。中间我遇到了xxx问题,所以得到或者没得到xxx结果。我为了解决这个问题,好刻苦的!我读了xxx,问了xxx。书里面说xxx,别人给我的意见是xxx。总结下来,关于这个问题,我猜测原因可能是xxx和x

2021-11-06 10:59:10 1570

原创 基于注意的U-Net和改进的交叉熵卷积神经网络的视盘分割

Optic Disc Segmentation Using Attention-Based U-Net and the Improved Cross-Entropy Convolutional Neural Network使用带注意力的U-Net和改进的交叉熵卷积神经网络的视盘分割技术:多通道注意力机制,骰子系数与交叉熵结合,卷积神经网络————————————————————————————————摘要:在本文中,我们提出了一种新的聚合通道注意力网络,以充分利用上下文信息对语义分割的影响。与现有

2021-10-24 17:02:46 2308

原创 CV经典网络DenseNet的学习

论文:Densely Connected Convolutional Networks代码链接:Dense NetMXNet版本代码(有ImageNet预训练模型)DenseNet的优点:1、减轻了vanishing-gradient(梯度消失)2、加强了feature的传递3、更有效地利用了feature4、一定程度上较少了参数数量--------------------------- dense block结构图 ---------------------------在传统的卷积神

2021-10-24 15:15:19 2850

原创 椎体压缩性骨折与骨密度:CT图像的自动检测与分类

椎体压缩性骨折与骨密度:CT图像的自动检测与分类Vertebral Body compression Fractures and Bone Density: Automated Detection and Classification on CT Images简单总结:目的:在CT图像上检测、定位和分类压缩性骨折,并测量胸椎和腰椎椎体的骨密度—————————————————————————————————摘要目的:创建并验证计算机系统,用于在CT图像上检测、定位和分类压缩性骨折,并测量胸椎和腰

2021-10-18 20:11:35 1343

原创 MRI扫描中检测颈脊髓压迫的深度学习模型

MRI扫描中检测颈脊髓压迫的深度学习模型A deep learning model for detection of cervical spinal cord compression in MRI scans简单总结目的:在MRI扫描中检测颈脊髓压迫方法:深度学习模型label:“受压” 和 “未受压”摘要脊髓受压的磁共振成像(MRI)证据在退行性颈椎病(DCM)的诊断中起着核心作用。人们越来越认识到,深度学习模型可能有助于解决不断增加的医学影像数据量,并提供初级保健环境中收集的图像的初步解释

2021-10-18 19:51:34 593

原创 基于深度学习的x射线图像骨龄自动特征提取

基于深度学习的x射线图像骨龄自动特征提取Automatic Feature Extraction in X-ray Image Based on Deep Learning Approach for Determination of Bone Age数据:x射线图像利用深度神经网络学习x射线图像的特征。然后,采用基于支持向量机的分类方法对特征进行分类。摘要目的:骨龄测定是判断骨骼成熟度和生长潜力的重要方法。本文提出了一种通过x射线图像识别确定骨龄的方法,通过与现有技术的比较,获得了更好的识别效果。

2021-10-18 19:18:20 991 1

原创 电子健康记录的风险预测:一种深度学习方法

电子健康记录的风险预测:一种深度学习方法Risk Prediction with Electronic Health Records: A Deep Learning Approach将每个患者的电子健康记录(EHR)表示为一个维度为时间和事件的矩阵。通过卷积神经网络模型进行学习和预测。摘要直接使用电子健康记录(EHR)存在许多挑战,如时间性、稀疏性、噪声、偏差等。因此,有效的特征提取,或患者EHR表型是任何进一步应用之前的关键步骤。在本文中,我们提出了一种深度学习方法来从患者的电子病历中进行表型分

2021-10-18 16:26:49 674

原创 基于ATMFCMC医学图像分割方法的颈椎病检测与分类

基于ATMFCMC医学图像分割方法的颈椎病检测与分类Spondylosis Detection And Classification Of Cervical Images Using ATMFCMC Based Medical Image Segmentation Methods用机器学习算法对x射线图像颈椎病的检测(本质:分类)摘要在这项工作中,我们试图实现对x射线或ct扫描图像的分割来检测颈椎病。本工作用于实现机器学习算法对x射线图像颈椎病的检测。该任务是基于早期检测颈椎骨骼图像中的疾病,然后

2021-10-17 21:38:10 378

原创 用于预测脊柱转移术后30天死亡率的机器学习算法的开发

用于预测脊柱转移术后30天死亡率的机器学习算法的开发Development of Machine Learning Algorithms for Prediction of 30-Day Mortality After Surgery for Spinal Metastasis开发了四种机器学习算法(分类),并将表现最佳的算法集成到一个开放访问web应用程序中摘要背景:术前预测脊柱转移性疾病患者术后短期死亡率可以改善临终护理的共同决策。目的:(1)开发用于预测短期死亡率的机器学习算法;(2)将这些

2021-10-17 20:32:00 264

原创 使用机器学习方法预测退行性颈椎病手术后的预后

使用机器学习方法预测退行性颈椎病手术后的预后Using a machine learning approach to predict outcome after surgery for degenerative cervical myelopathy提出基于机器学习的分类模型,来预测病人退行性颈脊髓病DCM的术后结果。摘要退行性颈脊髓病(DCM)是一种脊髓疾病,导致颈椎脊髓的渐进性非创伤性压迫。脊柱外科医生必须考虑与疾病表现、影像学特征和患者特征相关的大量信息,以确定患者是否能从DCM手术中获益。我

2021-10-17 19:57:03 615

原创 基于OpenPose的坐姿识别

基于OpenPose的坐姿识别简单说,就是提取18个身体关节和17条连接关节的线,作为提取到的坐姿特征。介绍坐姿识别方法可以分为两类:基于传感器的方法和基于图像的方法。构建数据集一个提取人体姿势的工具是OpenPose。OpenPose人体姿态识别项目是卡内基梅隆大学(Carnegie Mellon University, CMU)基于卷积神经网络和监督学习开发的一个开源库,在caffe[14]框架下开发。姿态估计,如人体运动,面部表情,手指运动。适用于单人和多人,具有极佳的鲁棒性[15]。Op

2021-10-17 19:06:51 11799 1

原创 课程学习 CV 北京邮电大学 鲁鹏(笔记九:实例分割)

实例分割的经典网络Mask R-CNN在Faster R-CNN 的基础上,加上Mask模块,成为Mask R-CNNMask R-CNN的效果也可以做关键点检测,姿势检测。其他开源框架

2021-10-12 18:58:00 154

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除