自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 【代码解读】OpenCLIP模型创建代码详解

对CLIP模型创建进行解析,使用thaottn/OpenCLIP-resnet50-CC12M模型进行调试

2025-04-01 17:24:47 264

原创 【论文阅读】CARES:医学视觉语言模型可信度的综合基准

CARES,这是一个旨在评估医学 LVLM 可信度的综合基准。 它涵盖 16 种医学成像模式和 27 种解剖结构,通过不同的问题形式评估模型的可信度。 CARES 从多个维度--可信度、公平性、安全性、隐私性和稳健性--全面评估了医学 LVLM。

2025-03-19 20:57:15 1227 1

原创 【论文阅读】MMedPO: 用临床感知多模态偏好优化调整医学视觉语言模型

在这项工作中,提出了一种临床感知多模态偏好优化方法,该方法在偏好优化中考虑了每个偏好样本的临床相关性。现有工作生成的偏好样本(如简单错误答案)缺乏医学意义,导致模型无法有效区分关键错误,对齐效果受限。医学视觉-语言模型(Med-LVLMs)结合了视觉理解与自然语言处理能力,在疾病诊断、影像报告生成等任务中具有重要应用价值。提出了 MMedPO,一种临床感知多模态偏好优化方法,以解决 Med-LVLM 中模态不对齐的难题,包含三个关键步骤。提升模型对医学图像关键区域的理解,减少事实性错误。

2025-03-19 16:22:23 910 1

原创 【论文阅读】FairCLIP - 医疗视觉语言学习中的公平性提升

本文通过构建高质量数据集和提出FairCLIP方法,系统性地解决了医疗VL模型中的公平性问题。实验表明,数据驱动的分布对齐策略能有效缓解模型偏见,为医疗AI的伦理设计提供了新思路。未来需进一步验证方法在更广泛场景中的适用性,推动公平性研究从理论向实际应用的转化。

2025-03-18 22:08:18 1097 1

原创 【论文阅读】MMed-RAG:让多模态大模型告别“事实性幻觉”​

医疗多模态大模型(Med-LVLMs)在临床辅助诊断中潜力巨大,但面临两大难题:​脱离图像依赖文本幻觉​(回答正确但未参考实际影像)和检索噪声干扰​(被无关知识误导)。本文解读的论文提出双偏好对齐机制,通过设计两类偏好对,显著提升模型对医疗图像的理解能力和抗干扰性。实验证明,该方法将检索干扰错误率降低80%以上,为医疗AI可靠落地提供新思路。

2025-03-18 17:38:38 1040 1

原创 wow-rag学习|搞定模型

采用Llama-index来做RAG

2025-03-14 10:31:48 891

原创 wow-rag学习|手搓RAG

从0实现一个简易的RAG

2025-03-11 21:37:11 107

原创 【论文阅读】RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models

RULE:医学视觉语言模型中的可靠多模态事实性 RAG

2025-03-10 20:36:23 574 1

原创 推荐系统概述 | 《推荐系统教程》第一章笔记

推荐系统的整体概述

2025-02-10 22:55:49 787

原创 【论文阅读】大模型和多模态大模型在医学中的应用综述

大模型和多模态大模型在医学中的应用综述

2024-12-29 11:28:01 2285 1

原创 【论文阅读】MedCLIP: Contrastive Learning from Unpaired Medical Images and Text

MedCLIP: Contrastive Learning from Unpaired Medical Images and Text

2024-12-27 19:23:31 1237 1

原创 手写ViT

【代码】手写ViT。

2024-12-26 11:40:42 123

原创 【大模型微调学习7】-实战Hugging Face PEFT工具

实战Hugging Face PEFT 工具

2024-12-18 15:43:51 880

原创 【大模型微调学习6】-实战Hugging Face Transformers工具库

从0开始掌握Hugging Face的基本使用,通过每一个样例进行实战学习

2024-12-17 15:59:04 903

原创 【大模型微调学习5】-大模型微调技术LoRA

大模型微调技术LoRA

2024-12-17 11:13:07 681

原创 【大模型微调学习4】-大模型微调技术

大模型微调相关技术与发展

2024-12-10 23:37:04 923

原创 【大模型微调学习3】-统计语言模型,神经网络语言模型,基于Transformer大语言模型

主要介绍大语言模型技术发展与演进,还有一些大模型的基础知识。

2024-12-10 15:33:35 967

原创 【大模型微调学习2】-AI大模型四阶技术对比

对比AI大模型四阶技术

2024-12-09 16:32:44 1097

原创 【大模型微调学习1】-大模型微调的相关技术与应用

介绍一些大模型的相关技术与应用

2024-12-08 15:54:33 1318

原创 ChatGLM-6B微调

ChatGLM-B微调,ptuing,Full parameter finetuing,LoRA

2024-12-08 11:12:19 646

原创 【数据结构】十大基础数据结构(链表、栈、队列、并查集、字典树、字符串哈希)

1.最小值,双端队列里存最小值,所以只要进队列的元素小于队尾元素,将队尾元素出队,最后将元素入队。2.最大值,双端队列里存最大值,所以只要进队列的元素大于队尾元素,将队尾元素出队,最好将元素入队。单调栈解决的常见问题:给定一个序列,求每个位置左边,离他最近且小于他的数的位置。单调栈是栈的一中特殊形式,在栈中的元素必须满足单调性(一定是单调上升或单调下降等等的规律)。如果不满足某些性质,直接弹出栈顶,直到栈为空或满足该性质插入这个元素。既然我们必须让元素满足单调性,那么每次插入就和栈顶作比较。

2024-09-15 13:31:35 445

原创 【基础算法】9大基础算法(排序,查找,前缀和与差分,离散化,区间合并...)

9大基础算法

2024-09-09 16:51:04 668

原创 图像哈希4:基于四元数 SVD 的奇异值的鲁棒图像哈希

图像哈希4:基于四元数 SVD 的奇异值的鲁棒图像哈希(SCI Q2,CCF B)

2024-08-01 18:58:45 1281 2

原创 图像哈希3:基于四元数离散余弦变换的鲁棒感知图像哈希研究(性能优于近年一些较好的研究)

基于四元数离散余弦变换的鲁棒感知图像哈希研究,性能优于近年一些较好的研究

2024-08-01 16:44:05 390 1

原创 图像哈希2:基于环形分区和NMF的鲁棒感知图像哈希(CCF A),复现论文

基于环形分区和NMF的鲁棒感知图像哈希(CCF A)

2024-07-24 17:57:35 1244 1

原创 图像哈希1:基于四元数离散傅里叶变换和对数极坐标的鲁棒图像哈希算法,复现论文

基于四元数离散傅里叶变换和对数极坐标的鲁棒图像哈希算法

2024-07-21 17:14:42 842 1

原创 英语作文

原题链接题目描述在写英语作文的时候,两个相同单词靠的太近肯定不好。现在 ZHR 给了你一段n个单词的英文,问你有多少对相同单词中间间隔的单词数小于等于k 。输入描述:第一行两个整数,为n和 k。第二行nnn个由仅小写字母组成的单词。每个单词长度小于等于10 。1输出描述:一行一个正整数,表示有多少对单词中间间隔的单词数小于等于k。示例1输入11 2i love you you love mi mixue ice cream and tea输出2..

2022-04-10 19:17:12 856

原创 AcWing 4312. 出现次数

原题链接题目描述给定一个长度为 n的字符串 以及一个长度为 m 的字符串 T=。两个字符串都由小写字母构成。用 来表示字符串 S的子串 。有 q 个询问,每个询问给出两个整数(),请你计算字符串 T在 中作为子串出现了多少次。例如,字符串 abacabadabacaba 中共包含 4个子串 ba,所以 ba 在 abacabadabacaba 中作为子串出现了 4次。输入格式第一行包含三个整数n,m,q。第二行包含一个长度为n的由小写字母构成的字符串S。第三...

2022-03-20 00:53:25 1223

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除