- 博客(139)
- 收藏
- 关注
原创 Segment Anything: SAM & SAM2
梳理了一下经典的 Segment Anything SAM 和它用于分割视频的续作SAM2 的模块。
2025-11-02 23:40:19
847
原创 KGGEN: 用语言模型从纯文本中提取知识图
人工生成的知识图谱数量有限,而自动抽取的知识图谱往往质量堪忧。本文提出了一种解决数据稀缺问题的新方法——一个文本到知识图谱(text-to-KG)生成器 KGGen。该方法利用语言模型从纯文本中生成高质量的知识图谱。与其他知识图谱抽取器不同,KGGen 会对相关实体进行聚类,以减少生成图谱中的稀疏性。
2025-10-31 09:51:20
749
原创 Symbolic Representation 用于 任意到任意生成任务
我们提出了一种符号化生成任务描述语言,并结合了一个推理引擎(inference engine),提供了一种全新且高效的方式,用于表示和执行多模态任务,且无需针对特定任务进行训练。通过利用预训练的大语言模型(LLM)来推理符号化任务描述,我们的方法成功地合成了多种多样的多模态生成任务,充分展示了其灵活性以及在统一不同类型生成式 AI 能力方面的潜力。
2025-10-30 14:10:02
783
原创 SR-Scientist: 利用 ai agent 进行科学公式的发现
在本文中,我们介绍了 SR-Scientist 框架,该框架将大型语言模型从被动的方程提出者转变为用于符号回归的自主科学家。通过分析数据、评估和优化方程,该智能体通过主动与环境交互生成并优化假设。我们的实验表明,SR-Scientist 在精度、泛化能力、对噪声的鲁棒性以及符号准确性方面显著优于现有方法。此外,我们开发了一个完整的强化学习管道,使智能体能够自我进化并增强其发现能力。
2025-10-28 21:27:44
1025
原创 Agent Laboratory: 利用 LLM Agent 作为研究助手
一个自动生成论文的agent, 该框架以人类提供的研究想法为起点,依次经历文献综述、实验实施与报告撰写三个阶段,最终产出完整的科研成果,包括代码仓库与研究报告。是启发性工作,效果难以达到实际学术需求水准,所以主要分析和思考了一下Method 部分。
2025-10-26 23:48:41
743
原创 github 个人静态网页搭建(一)部署
今年因为开学一个月之后才拿到签证被迫gap了,最近论文没啥好思路,再则又攒了点文章想着看看能不能申请个更好的项目所以搭个个人网站,本人之前纯算法开发可以说0经验,所以这个笔记也希望帮到更多的人?以后个人网站和csdn同步更新啦,github 关注主播Scabbards1500谢谢喵
2025-10-19 22:30:27
2837
3
原创 Aristotle: Mastering Logical Reasoning with A Logic-Complete Decompose-Search-Resolve Framework
本文提出Aristotle,一个逻辑完备的LLM推理框架,通过结构化整合符号逻辑提升效能与效率。传统方法(如Chain-of-Thought)在逻辑任务中存在子任务断裂、搜索冗余和矛盾未解等问题。Aristotle创新性地引入三个模块:LogicalDecomposer(基于逻辑结构分解问题)、LogicalSearchRouter(反证法搜索矛盾)和LogicalResolver(逐步消解冲突),首次实现符号逻辑在推理全流程的深度融合。
2025-08-08 23:54:47
1046
原创 Evolver: Chain-of-Evolution Prompting to Boost Large Multimodal Modelsfor Hateful Meme Detection
通过融合进步的文化理念,仇恨表情包(meme)不断演变,新的表情包不断出现,使得依赖广泛培训的现有方法变得过时或无效。在这项工作中,我们提出了Evolver,通过整合模因的进化属性和上下文信息,通过进化链(CoE)提示融合了大型多模态模型(Large Multimodal Models, LLM)。
2025-06-30 20:43:48
1056
原创 Faithful Logical Reasoning via Symbolic Chain-of-Thought
本研究提出符号思维链(Symbolic Chain-of-Thought, SymbCoT)框架,创新地将符号表达和逻辑规则与符号思维链提示相结合,以提高法学硕士的逻辑推理能力。具体来说,SymbCoT在主干LLM的基础上,将自然语言上下文翻译成符号格式,然后推导出一个循序渐进的方案,用符号逻辑规则来解决逻辑推理问题,然后由验证者来检查翻译和推理链。在FOL和CO符号表达的5个标准基准上的实验结果表明,SymbCoT在逻辑推理上显著增强了vanilla CoT。
2025-06-15 21:41:35
1051
原创 An Image isWorth 32 Tokensfor Reconstruction and Generation 一个图像值32个Token用于重建和生成
生成模型的最新进展突出了图像标记化(image tokenization )在高效合成高分辨率图像中的关键作用。与直接处理像素相比,标记化将图像转换为潜在表示(latent representations),减少了计算需求,提高了生成过程的有效性和效率。先前的方法,如VQGAN,通常使用具有固定下采样因子的二维潜在网格(2D latent grids)。然而,这些二维标记化在管理图像中存在的固有冗余(inherent redundancies)方面面临挑战,其中相邻区域经常显示相似性。
2025-04-14 19:37:42
1318
原创 人工智能的未来:探索大型概念模型的潜力
Meta引入了大型概念模型(Large Concept Models, lcm),代表了传统的基于令牌的框架的重大转变。lcm使用概念作为理解的基本单位,支持更复杂的语义推理和上下文感知决策。鉴于这一新兴技术的学术研究有限,我们的研究旨在通过收集、分析和综合现有的灰色文献来弥补知识差距,以提供对lcm的全面了解。具体来说,我们(i)识别和描述LCM与llm的区别特征,(ii)探索LCM在多个领域的潜在应用,(iii)提出未来的研究方向和实际策略,以推进LCM的发展和采用。
2025-03-21 15:04:44
881
原创 理解知识如何在大型Vision-Language Models 中演化
这项工作研究了多模态知识如何在lvlm中发展。使用early exit 和降维技术,我们设计了几种策略来跟踪模型中的知识,并在三个层次上探索这个主题:单个令牌概率、令牌概率分布和特征编码。基于两个关键节点,即关键层和突变层,我们首次深入了解了lvlm中的知识进化过程。此外,根据不同进化阶段的特点,我们还在模型压缩和幻觉消除等问题上探索了新的视角。
2025-03-10 20:47:11
1153
2
原创 一种基于滑动层合并的高效深度修剪大模型的方法
我们提出了一种滑动层合并方法 sliding layer merging method,该方法根据预定义的相似度阈值从上到下动态地选择和融合连续层 consecutive layers,从而在保持模型性能的同时简化了模型结构。
2025-03-09 16:57:24
918
原创 模型压缩梳理
最近在复现模型压缩的工作,看了一下视频稍微整理一下知识点。大概看了看深度学习模型的推理优化方法,包括模型小型化、低比特量化、模型剪枝及知识蒸馏。
2025-03-08 15:20:11
1063
原创 EGE-UNet:一种有效的分组增强UNet皮肤病灶分割方法
EGE-UNet以轻量级的方式集成了一个Group multi-axis Hadamard Product Attention module(GHPA)和一个Group Aggregation Bridge module(GAB)。GHPA对输入特征进行分组,并在不同轴上执行Hadamard Product Attention mechanism(HPA),从不同角度提取病理信息。
2025-03-04 15:35:55
1149
原创 基于实例感知交互的联合的显微电镜图像去噪与分割
我们的框架包括三个组成部分:去噪网络、分割网络和促进特征级交互的融合网络。首先,去噪网络减轻了噪声的退化。随后,分割网络学习实例级亲和先验,编码重要的空间结构信息。最后,在融合网络中,我们提出了一种新的实例感知嵌入模块(IEM),利用分割特征中的重要空间结构信息进行去噪。IEM在统一的框架内实现了两个任务之间的交互,并通过联合训练机制促进了从去噪到分割的隐式反馈。
2025-01-22 21:22:47
915
原创 用于牙科的多任务视频增强
视频辅助牙科干预中的视频增强减轻了低光、噪音、模糊和相机握手等降低视觉舒适度的问题。为此,我们引入了一种新的深度网络,用于多任务视频增强,使牙科场景的宏观可视化。特别是,该网络以多尺度方式联合利用视频恢复和时间对齐来有效增强视频。
2025-01-21 15:07:58
1396
原创 INT305 Machine Learning
siyue 今年新皇登基,大赦天下!23 ics wcl 同学此刻已是机器学习大师了,拼尽全力无法战胜,教我教我教我教我教我教我教我教我教我教我教我教我教我教我教我
2025-01-06 12:57:58
1316
原创 CPT204 Advanced OO Programming(2)
CPT204是这样的,erick只要课改和把代码往ppt堆就可以,可是学生要考虑的事情就很多了
2024-06-12 15:32:11
1310
原创 分布移位下用于泛化的泛化的自监督测试时训练
在本文中,我们提出了测试时训练(test - time Training),这是一种在训练数据和测试数据来自不同分布时提高预测模型性能的通用方法。我们将单个未标记的测试样本转化为自监督学习问题,在进行预测之前更新模型参数。这也自然地扩展到在online stream中的数据。我们的简单方法可以改善不同的图像分类基准,旨在评估对分布变化的鲁棒性。主要是复现实验理解用写的略有点草率
2024-04-19 15:33:41
1459
CPT107 离散数学 期末复习笔记配套例题
2023-01-06
CPT107 期末复习笔记
2023-01-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅