论文研读
文章平均质量分 89
proteroh
谢谢您的关注,欢迎一起交流学习
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Palm数据重叠分析
5. Data Overlap Analysis”部分通过严谨的方法,量化了CLIP预训练数据与下游评估数据的重叠风险,核心结论是**“数据重叠规模小、对性能影响可忽略”**——这为CLIP后续的零样本性能评估提供了重要可信度支撑,也为其他大规模预训练模型的“数据重叠分析”提供了可复用的流程框架(如近重复检测模型设计、子集划分逻辑、性能影响量化指标)。原创 2025-11-03 09:36:55 · 855 阅读 · 0 评论 -
TACL 2023 |《Data Contamination Quiz: A Tool to Detect and Estimate Contamination in Large Language》
LLMs 数据污染检测方法。原创 2025-11-01 19:17:17 · 609 阅读 · 0 评论
分享