- 博客(56)
- 收藏
- 关注
原创 Evaluating Very Long-Term Conversational Memory of LLM Agents 论文
尽管最近在基于LLM的对话模型方面取得了进步(Bertsch等,2023;Xiao等,2023),以及检索增强生成(RAG)的整合(RAG)技术(Shuster等,2021;Ram等,2023;Shi等,2023),仍然需要彻底评估它们在处理非常长的对话中的功效。实际上,长期opendomain对话中的研究集中于评估有限环境中的模型响应,例如,在五个聊天过程中约为1k令牌(Xu等,2022;Jang等,2023b;Zhang等,2023)。
2025-02-10 17:29:41
860
原创 CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation 论文
检索提示的一代(RAG)已成为有关的一种有前途的方法回答,利用大型语言模型(LLM)以及外部知识检索以提高生成响应的质量和准确性(Lewis等,2020;Guu等;Guu等,2020;2020;黄和黄,2024)。尽管RAG在学术界和行业都受到了吸引力,但在学术环境中研究的方式与在现实世界中的实施方式之间存在显着差距。学术研究主要集中于单转弯相互作用(Tan等,2024;Jin等,2024;Wang等,2024;Dong等人,Dong等人,2024a;
2025-02-08 21:57:56
770
原创 CoAT: Chain-of-Associated-Thoughts Framework for Enhancing Large Language Models Reasoning 论文
现有作品,例如LLM-MCT [Zhao等,2024],LLM Agent Tree Search(LATS)[Zhou等,2023]和通过计划(RAP)的推理[Hao等,2023]已将MCT整合到特定的AI系统中为了改善搜索空间探索,但其在LLMS中的应用仍然有限。比较方法是Nativerag [Lewis等,2020],Ircot [Trivedi等,2022],Hipporag [Gutierrez´等,2024],Lats [Zhou等,2023]和Kag [Liang等,2024]。
2025-02-07 22:25:02
926
原创 LONGMEMEVAL: BENCHMARKING CHAT ASSISTANTS ON LONG-TERM INTERACTIVE MEMORY 论文
大型语言模型(LLMS)在通过自然语言解决各种任务方面表现出了令人印象深刻的能力,从而导致了许多成功的聊天助理应用程序(OpenAI,2022;然而,LLMS仍面临严重依赖通过长途用户互动(例如心理咨询或秘书职责)积累的个人知识的任务的限制(Zhong等,2024)。未能将用户背景和偏好纳入响应中可以降低响应的准确性以及用户满意度。为了个性化基于LLM的助手,长期记忆,与长期互动历史记忆和理性的能力是必不可少的。最近,已经引入了一些商业(Openai,2024;
2025-02-07 22:08:12
1026
原创 Tell Me More! Towards Implicit User Intention Understanding ofLanguage Model Driven Agents 论文
大型语言模型,包括 OpenAI GPT(OpenAI,2022、2023)、LLaMA(Touvron 等,2023a、b)和 Mistral 系列(Jiang 等,2023)在高质量文本和代码生成(Zeng 等,2022;Chowdhery 等,2023;Touvron 等,2023b)、复杂逻辑推理(Wei 等,2022;Gao 等,2023;Yao 等,2022、2023)和使用外部工具(Schick 等,2023;Qin 等,2023、2024)方面取得了长足进步。
2025-02-06 22:44:54
877
原创 Effective High-order Graph Representation Learning for Credit Card Fraud Detection 论文阅读
摘要: 信用卡欺诈给持卡人和发卡银行都带来了巨大的成本。欺诈者经常伪装他们的罪行,例如通过几个良性用户进行合法交易来绕过反欺诈检测。现有的图神经网络(GNN)模型在学习伪装的间接多跳交易的特征时遇到困难,因为它们在深度多层聚合中存在固有的过度平滑问题,这对检测伪装关系提出了重大挑战。因此,在本文中,我们提出了一种新颖的高阶图表示学习模型(HOGRL),以避免在多层聚合过程中引入过多的噪声。具体而言,HOGRL 直接从高阶交易图中学习不同阶的纯表示。我们通过首先有效地构建高阶交易图,然后学习每个阶的纯表示来实
2025-01-25 15:14:11
964
1
原创 Can Large Language Models be Good Emotional Supporter?Mitigating Preference Bias on Emotional 论文
情感支持对话(ESC)旨在通过参与对话来缓解个体的情绪强度,并为应对个人挑战提供指导(Langford et al ., 1997;格林,2003;有效的情感支持不仅包括提供有用的情感支持,还包括避免劣质的情感支持,否则会恶化一种已经很紧张的情况,可能会导致许多心理、关系和身体问题(Burleson, 2003)。然而,提供情感支持是一项复杂且不直观的任务,甚至对人类来说也是一项挑战(Burleson, 2003)。
2025-01-23 21:01:21
772
1
原创 Dynamic Strategy Planning for Efficient Question Answering with Large Language Models 论文
摘要: 研究表明,推理(例如,思维链)、规划(例如,SelfAsk)和检索增强生成策略可有效提高大型语言模型 (LLM) 在各种任务(例如问答)上的性能。但是,使用单一固定策略回答不同类型的问题在性能上并不是最优的,并且在生成的输出标记和执行的检索方面效率低下。在我们的工作中,我们提出了一种新颖的技术 DyPlan,以在 LLM 中引入动态策略选择过程,从而提高性能并降低问答成本。DyPlan 结合了初始决策步骤,根据输入问题选择最合适的策略,并相应地指导 LLM 的响应生成。我们将 DyPlan 扩展为
2025-01-23 12:24:33
658
原创 LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks 论文
摘要: 本文介绍了LongBench v2,这是一个旨在评估法学硕士处理需要深入理解和推理的长上下文问题的能力的基准。LongBench v2包含503个具有挑战性的多项选择题,上下文从8k到2M不等,跨越6个主要任务类别:单文档QA、多文档QA、长上下文学习、长对话历史理解、代码存储库理解和长结构化数据理解。为了保证数据的广度和实用性,我们收集了近100位高学历、不同专业背景的个人数据。我们采用自动化和人工审查过程来保持高质量和难度,导致人类专家在15分钟的时间限制下仅达到53.7%的准确率。我们的评估显
2025-01-22 15:25:22
874
原创 LongRAG: A Dual-Perspective Retrieval-Augmented Generation Paradigm for Long-Context Question 论文
摘要: 长上下文问答(Long-Context Question answer, LCQA)是一项具有挑战性的任务,其目的是对长上下文文档进行推理,从而得到问题的准确答案。现有的用于LCQA的长上下文大型语言模型(llm)经常与“迷失在中间”的问题作斗争。检索增强生成(RAG)通过提供外部事实证据缓解了这一问题。然而,它的分块策略破坏了全局的长上下文信息,并且由于大量的噪声,它在长上下文中的低质量检索阻碍了llm识别有效的事实细节。为此,我们提出了LongRAG,一个通用的、双视角的、健壮的基于llm的LC
2025-01-22 15:07:55
585
原创 Passage Segmentation of Documents for Extractive Question Answering RAG 论文
为了评估我们的logits引导的多颗粒分块器的影响,我们进行了实验,看看它在检索和下游QA任务上的表现。此外,我们观察到LGMGC在不同块大小的情况下表现出最小的标准偏差,这表明无论块大小θ如何,它都保持一致的性能,从而减少了在实际用例中对超参数调优的需求。在未来,在QA任务上集成更合理的自动评估指标,更符合人类的评估,比如[14][6],可能会帮助人们更全面地理解分块策略的重要性。此外,尽管检索器的性能很好,但上下文信息的缺乏以及检索块中过多的无关信息会阻碍合成器LLM提取准确关键信息的能力。
2025-01-22 14:38:40
808
原创 CPsyCoun: A Report-based Multi-turn Dialogue Reconstruction and Evaluation Framework for Chinese Psy
没有心理健康就没有健康”已不再只是一句口号,全球约 14% 的疾病负担归因于神经精神疾病(Prince 等人,2007 年)。尽管许多心理健康治疗价格实惠且有效,但有需要的人和能够获得治疗的人之间仍然存在巨大差距(Freeman,2022 年)。世界卫生组织 (WHO)不断倡导增加投资以增进理解并消除与精神疾病相关的耻辱感。然而,确保精神疾病的优质、负担得起的护理的挑战仍然十分艰巨。因此,确定新疗法和增强所有精神疾病的现有疗法是研究领域的关键目标。
2025-01-17 04:35:10
624
原创 Semi-supervised Credit Card Fraud Detection via Attribute-Driven Graph Representation 论文阅读
信用卡欺诈会给持卡人和发卡银行带来相当大的成本。当代方法应用基于机器学习的分类器从标记的交易记录中检测欺诈行为。但由于昂贵的标记成本,标记数据通常只占数十亿实际交易的一小部分,这意味着它们不能很好地利用未标记数据中的许多自然特征。因此,我们提出了一种用于欺诈检测的半监督图神经网络。具体来说,我们利用交易记录构建一个时间交易图,该图由时间交易(节点)和它们之间的交互(边)组成。然后,我们通过门控时间注意网络 (GTAN) 在节点之间传递消息以学习交易表示。我们进一步通过交易间的风险传播来建模欺诈模式。
2025-01-17 01:43:50
1042
1
原创 ODA: Observation-Driven Agent for integrating LLMs and Knowledge Graphs
大型语言模型和知识图的集成在各种自然语言处理任务中取得了显著的成功。然而,现有的集成LLM和KGs的方法通常只基于LLM对问题的分析来导航任务解决过程,忽略了KGs中包含的大量知识所固有的丰富的认知潜力。为了解决这个问题,我们引入了观察驱动代理(ODA ),一个新的人工智能代理框架。ODA通过全局观察整合了KG推理能力,通过观察、行动和思考的循环范式增强了推理能力。面对观测过程中知识的指数级爆炸,我们创新性地设计了递归观测机制。随后,我们将观察到的知识整合到行动和反思模块中。
2025-01-16 22:24:49
759
原创 Ensemble Learning via Knowledge Transfer for CTR Prediction 论文阅读
Knowledge Distillation (KD)[13]是一种被广泛采用的知识转移方法,其目的是将知识从一个大的教师模型转移到一个小的学生模型中,以提高学生模型的性能,如图1 (a)所示。Deep Mutual Learning (DML)[44]抛弃了传统的教师模型,有效地将学生变成彼此的老师,建立了多个学生模型。它鼓励这些模型相互学习,从而促进点对点的知识转移,如图1 (b)所示。
2024-12-07 19:38:32
1181
1
原创 Sequence As Genes: An User Behavior Modeling Framework for Fraud Transaction Detection in E-commerce
随着电子商务行业的不断发展和商业创新,大量的营销资金不断投入到网络营销活动中,如发放购物补贴或打折产品等。由于机制设计上的漏洞和活动规则的不完善,欺诈者可以伪装成普通消费者来获取非法利润。因此,电子商务平台必须建立健全的反欺诈系统,以减少经济损失。最近,有一堆工作[3,16,22,23,37,40]被提出,证明了用户行为序列数据在电子商务平台反欺诈系统中的有效性。用户行为序列数据记录了用户在平台上的活动轨迹,为欺诈检测提供了丰富的信息。在这些工作中,用户行为序列在检测用户意图和欺诈倾向方面发挥了重要作用。
2024-12-07 17:27:51
969
原创 爱丁堡RP要求
摘要是用与应用程序其余部分相同的样式编写的简短摘要。它将向读者提供你的提案的要点和结论。•介绍研究领域•审查关键出版物•确定知识或必须回答的问题中的任何空白•您的假设•您的目的和目标,包括对方法的简要描述•您的研究如何有益以及对谁有益。
2024-12-04 19:59:04
811
原创 ADVWEB: CONTROLLABLE BLACK-BOX ATTACKS ON VLM-POWERED WEB AGENTS
大型语言模型(llm)和视觉语言模型(vlm)的快速发展促进了多面手网络代理的发展,这些网络代理能够自主地与现实世界的网站交互并执行任务(Zhou等人,2023;Deng等,2024;郑等,2024)。通过利用工具、api和复杂的网站交互,这些代理在提高各个领域(包括金融、医疗保健和电子商务等高风险领域)的人类生产力方面具有巨大潜力。然而,尽管这些代理具有令人印象深刻的能力,但它们也带来了前所未有的安全挑战,特别是在它们对对抗性攻击的稳健性方面——这是一个在现有研究中仍未充分探索的关键问题。
2024-12-03 21:07:51
1059
原创 EIA: ENVIRONMENTAL INJECTION ATTACK ON GENERALIST WEB AGENTS FOR PRIVACY LEAKAGE
paper:2409.11295最近,多面手网络代理在自主完成真实网站上的广泛任务方面显示出显着的潜力,显着提高了人类的生产力。然而,网络任务,如预订航班,通常涉及用户的个人身份信息(PII),如果网络代理意外地与受感染的网站交互,这些信息可能会暴露在潜在的隐私风险中——这种情况在很大程度上仍未在文献中探索。在这项工作中,我们通过对对抗环境中多面手网络代理的隐私风险进行首次研究,缩小了这一差距。首先,我们提出了一个针对网站攻击的现实威胁模型,其中我们考虑了两个敌对目标:窃取用户的特定PII或整个用户请求。然
2024-12-03 19:46:17
821
原创 LLM Agents can Autonomously Hack Websites 论文阅读
在讨论我们使用LLM代理自主入侵网站的方法之前,我们首先提供了LLM代理的概述和网络安全的要点。
2024-12-03 17:58:27
916
1
原创 Switching Temporary Teachers for Semi-Supervised Semantic Segmentation 论文阅读
随着深度神经网络的发展,语义分割作为视觉理解的计算机视觉任务的关键组成部分也在不断发展[8,9,55]。然而,流行的方法主要是基于监督学习方法,仍然需要在像素级进行费力和耗时的手动注释。为了缓解这种内在的挑战,半监督语义分割最近成为人们关注的焦点,它只需要少量的标签。成功的半监督学习的一个关键挑战是如何从未标记的数据中获得可靠和一致的标签,特别是在半监督分割等要求更高的任务中。伪标记[22]是最流行的方法,它将现成模型的类预测作为未标记数据的标签进行训练。
2024-10-11 21:27:50
1272
1
原创 AnatoMask: Enhancing Medical Image Segmentation with Reconstruction-guided Self-masking 论文阅读
为了解决这些挑战,我们提出了AnatoMask,这是一个重建引导的MIM框架,模型从更多的信息掩模中学习,以提高预训练效果。我们首先比较了随机掩蔽和我们的AnatoMask之间的差异(图1c和d),然后比较了AnatoMask与随机掩蔽(SparK[37])的训练效率(图1e)。因此,以往的方法需要更多的训练数据才能达到预期的效果,这极大地限制了它们在医学相关任务中的应用。因此,为了设计一个有效的医学图像MIM框架,识别这些复杂的解剖区域是至关重要的,并创建一个更具挑战性的任务。分析[8,9,49]。
2024-10-01 18:22:55
1078
1
原创 MagicNet: Semi-Supervised Multi-Organ Segmentation via Magic-Cube Partition and RecoveryMagicNet 论文
CT图像中腹部多器官的分割是许多临床应用中的一项重要任务计算机辅助干预[25,33]。但是,训练一个准确的多器官分割模型通常需要大量的标记数据,而这些数据的获取过程既耗时又昂贵。半监督学习(SSL)在处理数据注释的稀缺性方面显示出巨大的潜力,它试图将从标记图像中学习到的大量先验知识转移到未标记图像中。近年来,SSL在医学图像分析领域受到越来越多的关注。目前流行的SSL医学图像分割方法主要是对单个目标或局部区域的目标进行分割,如对胰腺或左心房进行分割[4,9,14,15,18,23,31,35,38,39]
2024-10-01 18:03:31
905
原创 Frequency-aware Feature Fusion for Dense Image Prediction 论文阅读
为了实现这一点,现代分层模型通常利用特征融合,直接添加来自深层的上采样粗特征和来自较低层次的高分辨率特征。在本文中,我们观察到融合特征值在对象内的快速变化,由于高频特征的干扰导致类别内不一致。此外,融合特征中模糊的边界缺乏准确的高频,导致边界位移。ALPF生成器预测空间变化的低通滤波器,以衰减对象内的高频组件,减少上采样期间的类内不一致。偏移量发生器通过重采样将不一致的特征替换为更一致的特征来细化大的不一致特征和细边界,而AHPF发生器增强了下采样过程中丢失的高频详细边界信息。
2024-10-01 17:16:37
879
1
原创 XNet: Wavelet-Based Low and High Frequency Fusion Networks for Fully- and Semi-Supervised 论文阅读
随着深度神经网络(dnn)的发展,生物医学图像的全监督和半监督语义分割得到了进一步的发展。然而,到目前为止,深度神经网络模型通常被设计为支持这两种学习方案中的一种,支持全监督和半监督分割的统一模型仍然有限。此外,很少有全监督模型关注图像的固有低频(LF)和高频(HF)信息来提高性能。基于一致性的半监督模型中的扰动通常是人为设计的。他们可能会引入不利于训练的消极学习偏见。在这项研究中,我们提出了一种基于小波的LF和HF融合模型XNet,它支持全监督和半监督语义分割,并且在这两个领域都优于最先进的模型。
2024-10-01 17:10:01
1178
1
原创 Translation Consistent Semi-supervised Segmentation for 3D Medical Images 阅读
code:
2024-09-26 13:24:53
1220
原创 Self Pseudo Entropy Knowledge Distillation for Semi-supervised Semantic Segmentation 论文阅读
SUPERVISED语义分割方法依靠高质量的标记数据,在众多图像领域取得了显著的效果,如自然图像[1]-[4]、遥感图像[5]-[8]、医学图像[9]-[12]等。然而,在一些实际场景中,由于耗时的数据收集和标注,以及需要专业的理解,很难获得专家注释。此外,标注者的主观认知偏差问题使监督学习容易过拟合偏差,从而使模型无法学习到数据中嵌入的正确知识。为了解决这个问题,半监督语义分割得到了很多关注[13]-[35],它利用大量的原始数据来辅助训练,当只有很少的标记数据可用时。
2024-07-20 15:11:21
937
1
原创 Contrmix:用于半监督医学图像分割的渐进式混合对比学习
由于获取医学图像密集像素级注释相关的挑战,半监督学习(SSL)技术作为一种新的技术已经引起了广泛的关注。用有限数量的注释数据训练模型的有效方法[1,2]。基于流形假设和平滑假设[3],一致性正则化在SSL框架中得到了广泛的应用。其中一个突出的框架是Mean Teacher[4],它已经证明了它在各种视觉任务中的有效性。基于混合的数据处理策略近年来引起了大量的研究[5,6]。一些研究已经在SSL中引入了适当的基于混合的数据增强技术,以进一步提高性能[7]。
2024-06-19 15:17:01
1210
原创 DHC: Dual-debiased Heterogeneous Co-training Framework for Class-imbalanced Semi-supervised 阅读
code:xmed-lab/DHC: MICCAI 2023: DHC: Dual-debiased Heterogeneous Co-training Framework for Class-imbalanced Semi-supervised Medical Image Segmentation (github.com)paper:2307.11960 (arxiv.org)摘要。三维医学图像的体积标记是专业要求和耗时的;因此,半监督学习(SSL)非常适合使用有限的标记数据进行训练。不平衡的类分布是一个
2024-06-11 18:41:58
755
原创 HybridMIM: A Hybrid Masked Image ModelingFramework for 3D Medical Image Segmentation 阅读
基于变主干的掩膜图像建模(MIM)作为一种强大的自监督预训练技术,近年来得到了广泛的应用。现有的MIM方法采用的策略是对图像的随机斑块进行掩码,重建缺失的像素点,只考虑较低层次的语义信息,预训练时间较长。提出了一种基于掩模图像建模的混合自监督学习方HybridMIM,用于医学三维图像分割。具体来说,我们设计了一个两级屏蔽层次结构来指定子卷中哪些补丁被屏蔽以及如何被屏蔽,有效地提供了更高级别语义信息的约束。然后,我们从三个层面学习医学图像的语义信息,包括:
2024-06-03 16:21:51
682
原创 Rethinking Barely-Supervised Segmentation from an Unsupervised Domain Adaptation Perspective 阅读
医学图像分割对器官和肿瘤的描绘在临床应用中是必不可少的。基于监督学习已经取得了相当大的进步,它依赖于大规模的完全和完全标注的数据集,整个数据集都是完全标注的,每个样本都有一个完整的标签。然而,在像素级对医学图像进行标注非常费力,并且需要专业知识,导致标注负担很大。半监督学习(SSL)[16,10,14]和弱监督学习(WSL)[20,19]是缓解医学图像分割标注负担的两种主流范式。尽管如此,仍然有成千上万的切片需要在像素级别进行标记。
2024-05-30 23:57:08
729
原创 GenAINet: Enabling Wireless Collective Intelligence via Knowledge Transfer and Reasoning 论文
第六代(6G)无线网络被设想为人工智能原生网络,从某种意义上说,无线通信将成为训练和推理的一个组成部分。传统上,无线网络是为数据采集和传输而设计的,旨在实现有针对性的服务质量(QoS)。然而,它们并不是为了支持大规模部署人工智能设备而设计的,特别是对于具有高通信和计算成本的大型人工智能模型。建立在生成式预训练转换器(GPT)上的大型语言模型(llm)已经显示出令人印象深刻的能力,从问题回答和语言理解到数学和常识推理[1]。这些功能促进了法学硕士在机器人、电信、金融、医疗保健等领域的广泛采用。
2024-05-30 23:32:06
938
原创 CtxMIM: Context-Enhanced Masked Image Modeling for Remote Sensing Image Understanding 论文
遥感影像已广泛应用于精准农业、灾害管理、城市规划、环境监测等领域。随着越来越多的卫星不断采集遥感图像,丰富的遥感图像易于获取,但标注在技术上具有挑战性与一般的基准数据集(如ImageNet[43])相比,由于耗时和专业知识方面的问题。最近,自监督学习(SSL)越来越多地出现在大型未标记数据的预训练模型中,并且在分类、分割和检测方面表现出比监督学习更强的性能。因此,SSL模式一直受到遥感界的关注,并探索在大规模未标记数据上获得一种有效的预训练模型,用于遥感图像的理解。
2024-05-26 16:57:25
1023
1
原创 CrossMatch: Enhance Semi-Supervised Medical Image Segmentation with Perturbation Strategies 论文阅读
SEMANTIC分割作为一种像素级的精确分类技术,在医学图像分析领域起着至关重要的作用。特别是在处理复杂的三维CT和MRI数据时,虽然全监督学习方法可以获得高精度的分割结果,但人工标注成本高,操作复杂,严重限制了其应用。在为了克服这一瓶颈,出现了半监督医学图像分割方法,并显示出巨大的潜力[1]。这些方法的核心在于将少量标注数据与大量未标注数据有效结合,降低标注的高成本,实现准确分割,同时促进在临床等场景的广泛应用。半监督学习(SSL)的主要挑战是如何有效地利用未标记数据的潜力。
2024-05-17 13:49:15
1070
1
原创 TOWARDS ROBUST AND EFFICIENT CLOUD-EDGE ELASTIC MODEL ADAPTATION VIA SELECTIVE ENTROPY 论文阅读
深度神经网络(dnn)在计算机视觉的广泛应用中取得了显著突破(He等人,2016;Dosovitskiy等人,2021)到自然语言处理(Radford等人,2018;在实际应用中,dnn的传统部署流程如下:1)在云服务器上训练大型/基础模型,2)将大型/基础模型提取/压缩为较小的模型,部署在边缘设备中,用于延迟敏感应用。当测试样本与训练样本共享相同的分布时,该管道获得了巨大的成功。然而,在现实世界的边缘设备中,环境可能会动态变化,测试样本的分布与训练样本的分布是不同的。
2024-05-16 16:13:22
305
1
原创 Discrepancy Matters: Learning from Inconsistent Decoder Features for Consistent Semi-supervised 论文
医学图像的精确分割是计算机辅助诊断的关键任务[1]。在大规模数据集上训练的深度学习模型最近在这一任务上显示出了很好的性能[2],[3]。然而,收集医学图像数据集不可避免地需要数据注释的专业知识,这是耗时和劳动密集型的,特别是对于体积数据。考虑到未标记数据相对容易从临床现场收集,半监督学习(semi-supervised learning, SSL)[4],[5]因其能够提高模型泛化的能力而越来越受到研究的关注利用大量未标记数据来增强有限的标记数据。
2024-05-16 11:53:09
713
原创 Escaping Saddle Points for Effective Generalizationon Class-Imbalanced Data 论文阅读
近年来,由于精心策划的数据集[34,45]的可用性,在视觉识别方面取得了很大进展,这些数据集在不同类别的样本频率方面得到了人为平衡。然而,现代现实世界的数据集往往是不平衡的(即长尾等)[33,49,50],并遭受各种分布转移。像深度神经网络这样的过度参数化模型通常会过度拟合具有高频率样本的类,而忽略少数样本(尾部)[8,50]。在这种情况下,当对关注少数数据性能的指标进行评估时,这些模型的表现很差。这些指标是评估各个领域(如公平性[14]、医学成像[57]等)模型的基本和实用标准。
2024-04-26 19:57:30
1030
2
原创 Pseudo Label-Guided Data Fusion and OutputConsistency for Semi-Supervised Medical Image 阅读
分割是医学图像处理与分析领域的一项基础任务[1]。临床医学中准确的图像分割为临床医生提供有价值的辅助信息,促进快速、准确、高效的诊断决策[2]。然而,手动标注感兴趣的区域非常耗时,并且依赖于医生的临床专业知识,导致大量的工作量和潜在的错误[3]。随着深度学习的快速发展,卷积神经网络(CNN)及其变体在计算机视觉任务中展示了强大的图像处理能力。全卷积网络[4]和U-Net[5]的引入极大地推动了自动图像分割[6]的发展。在此基础上,出现了许多进一步提高分割算法性能的研究[7][8][9]。
2024-04-26 17:28:22
1004
1
原创 RCPS: Rectified Contrastive Pseudo Supervision for Semi-Supervised Medical Image Segmentation 论文阅读
医学图像中解剖结构或病变的准确、自动分割在许多领域都是非常需要的临床应用,包括影像引导介入、放射治疗、计算机辅助诊断等[1]。深度学习的快速发展导致了许多用于医学图像定量分析的图像分割方法的出现。然而,这些方法通常遵循完全监督的方式,这需要大量注释良好的数据才能达到令人满意的性能。同时,医学图像的手工注释成本高且费力,特别是对于CT和MRI扫描等3D图像。因此,开发能够减少对大量训练数据集需求的自动分割方法至关重要。
2024-04-13 20:05:10
1328
1
原创 VoCo: A Simple-yet-Effective Volume Contrastive Learning Framework for 3D Medical Image Analysis 阅读
深度学习在三维医学图像分析方面取得了突出的成就[52,21,39,33],但由于所需专家注释的昂贵成本而受到严重阻碍[49,23]。为了解决这个问题,自监督学习(self - supervised Learning, SSL)因其在没有注释的情况下学习表征的能力而受到了极大的关注[10,11,6,28,20]是三维医学图像分析中重要的高效标签解决方案[69,50,32,34,36]。
2024-04-11 01:28:29
1139
1
北邮果园Java课程wordle游戏实现
2024-03-03
北邮果园大四安全与认证课件以及翻译
2024-03-03
北邮果园大四云计算课件以及翻译
2024-02-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人