勤奋的小笼包-优快云博客

原创【代码解读】OpenCLIP模型创建代码详解

对CLIP模型创建进行解析，使用thaottn/OpenCLIP-resnet50-CC12M模型进行调试

2025-04-01 17:24:47 264

原创【论文阅读】CARES：医学视觉语言模型可信度的综合基准

CARES，这是一个旨在评估医学 LVLM 可信度的综合基准。它涵盖 16 种医学成像模式和 27 种解剖结构，通过不同的问题形式评估模型的可信度。 CARES 从多个维度--可信度、公平性、安全性、隐私性和稳健性--全面评估了医学 LVLM。

2025-03-19 20:57:15 1227 1

原创【论文阅读】MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型

在这项工作中，提出了一种临床感知多模态偏好优化方法，该方法在偏好优化中考虑了每个偏好样本的临床相关性。现有工作生成的偏好样本（如简单错误答案）缺乏医学意义，导致模型无法有效区分关键错误，对齐效果受限。医学视觉-语言模型（Med-LVLMs）结合了视觉理解与自然语言处理能力，在疾病诊断、影像报告生成等任务中具有重要应用价值。提出了 MMedPO，一种临床感知多模态偏好优化方法，以解决 Med-LVLM 中模态不对齐的难题，包含三个关键步骤。提升模型对医学图像关键区域的理解，减少事实性错误。

2025-03-19 16:22:23 910 1

原创【论文阅读】FairCLIP - 医疗视觉语言学习中的公平性提升

本文通过构建高质量数据集和提出FairCLIP方法，系统性地解决了医疗VL模型中的公平性问题。实验表明，数据驱动的分布对齐策略能有效缓解模型偏见，为医疗AI的伦理设计提供了新思路。未来需进一步验证方法在更广泛场景中的适用性，推动公平性研究从理论向实际应用的转化。

2025-03-18 22:08:18 1097 1

原创【论文阅读】MMed-RAG：让多模态大模型告别“事实性幻觉”

医疗多模态大模型（Med-LVLMs）在临床辅助诊断中潜力巨大，但面临两大难题：脱离图像依赖文本幻觉（回答正确但未参考实际影像）和检索噪声干扰（被无关知识误导）。本文解读的论文提出双偏好对齐机制，通过设计两类偏好对，显著提升模型对医疗图像的理解能力和抗干扰性。实验证明，该方法将检索干扰错误率降低80%以上，为医疗AI可靠落地提供新思路。

2025-03-18 17:38:38 1040 1

原创 wow-rag学习｜搞定模型

采用Llama-index来做RAG

2025-03-14 10:31:48 891

原创 wow-rag学习｜手搓RAG

从0实现一个简易的RAG

2025-03-11 21:37:11 107

原创【论文阅读】RULE: Reliable Multimodal RAG for Factuality in Medical Vision Language Models

RULE：医学视觉语言模型中的可靠多模态事实性 RAG

2025-03-10 20:36:23 574 1

原创推荐系统概述 | 《推荐系统教程》第一章笔记

推荐系统的整体概述

2025-02-10 22:55:49 787

原创【论文阅读】大模型和多模态大模型在医学中的应用综述

大模型和多模态大模型在医学中的应用综述

2024-12-29 11:28:01 2285 1

原创【论文阅读】MedCLIP: Contrastive Learning from Unpaired Medical Images and Text

MedCLIP: Contrastive Learning from Unpaired Medical Images and Text

2024-12-27 19:23:31 1237 1

原创手写ViT

【代码】手写ViT。

2024-12-26 11:40:42 123

原创【大模型微调学习7】-实战Hugging Face PEFT工具

实战Hugging Face PEFT 工具

2024-12-18 15:43:51 880

原创【大模型微调学习6】-实战Hugging Face Transformers工具库

从0开始掌握Hugging Face的基本使用，通过每一个样例进行实战学习

2024-12-17 15:59:04 903

原创【大模型微调学习5】-大模型微调技术LoRA

大模型微调技术LoRA

2024-12-17 11:13:07 681

原创【大模型微调学习4】-大模型微调技术

大模型微调相关技术与发展

2024-12-10 23:37:04 923

原创【大模型微调学习3】-统计语言模型，神经网络语言模型，基于Transformer大语言模型

主要介绍大语言模型技术发展与演进，还有一些大模型的基础知识。

2024-12-10 15:33:35 967

原创【大模型微调学习2】-AI大模型四阶技术对比

对比AI大模型四阶技术

2024-12-09 16:32:44 1097

原创【大模型微调学习1】-大模型微调的相关技术与应用

介绍一些大模型的相关技术与应用

2024-12-08 15:54:33 1318

原创 ChatGLM-6B微调

ChatGLM-B微调，ptuing,Full parameter finetuing,LoRA

2024-12-08 11:12:19 646

原创【数据结构】十大基础数据结构（链表、栈、队列、并查集、字典树、字符串哈希）

1.最小值，双端队列里存最小值，所以只要进队列的元素小于队尾元素，将队尾元素出队，最后将元素入队。2.最大值，双端队列里存最大值，所以只要进队列的元素大于队尾元素，将队尾元素出队，最好将元素入队。单调栈解决的常见问题：给定一个序列，求每个位置左边，离他最近且小于他的数的位置。单调栈是栈的一中特殊形式，在栈中的元素必须满足单调性（一定是单调上升或单调下降等等的规律）。如果不满足某些性质，直接弹出栈顶，直到栈为空或满足该性质插入这个元素。既然我们必须让元素满足单调性，那么每次插入就和栈顶作比较。

2024-09-15 13:31:35 445

原创【基础算法】9大基础算法（排序，查找，前缀和与差分，离散化，区间合并...）

9大基础算法

2024-09-09 16:51:04 668

原创图像哈希4：基于四元数 SVD 的奇异值的鲁棒图像哈希

图像哈希4：基于四元数 SVD 的奇异值的鲁棒图像哈希(SCI Q2,CCF B)

2024-08-01 18:58:45 1281 2

原创图像哈希3：基于四元数离散余弦变换的鲁棒感知图像哈希研究（性能优于近年一些较好的研究）

基于四元数离散余弦变换的鲁棒感知图像哈希研究，性能优于近年一些较好的研究

2024-08-01 16:44:05 390 1

原创图像哈希2：基于环形分区和NMF的鲁棒感知图像哈希(CCF A),复现论文

基于环形分区和NMF的鲁棒感知图像哈希(CCF A)

2024-07-24 17:57:35 1244 1

原创图像哈希1：基于四元数离散傅里叶变换和对数极坐标的鲁棒图像哈希算法,复现论文

基于四元数离散傅里叶变换和对数极坐标的鲁棒图像哈希算法

2024-07-21 17:14:42 842 1

原创英语作文

原题链接题目描述在写英语作文的时候，两个相同单词靠的太近肯定不好。现在 ZHR 给了你一段n个单词的英文，问你有多少对相同单词中间间隔的单词数小于等于k 。输入描述：第一行两个整数，为n和 k。第二行nnn个由仅小写字母组成的单词。每个单词长度小于等于10 。1输出描述:一行一个正整数，表示有多少对单词中间间隔的单词数小于等于k。示例1输入11 2i love you you love mi mixue ice cream and tea输出2..

2022-04-10 19:17:12 856

原创 AcWing 4312. 出现次数

原题链接题目描述给定一个长度为 n的字符串以及一个长度为 m 的字符串 T=。两个字符串都由小写字母构成。用来表示字符串 S的子串。有 q 个询问，每个询问给出两个整数（），请你计算字符串 T在中作为子串出现了多少次。例如，字符串 abacabadabacaba 中共包含 4个子串 ba，所以 ba 在 abacabadabacaba 中作为子串出现了 4次。输入格式第一行包含三个整数n,m,q。第二行包含一个长度为n的由小写字母构成的字符串S。第三...

2022-03-20 00:53:25 1223

m0_61222152的博客