自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Paper weekly

PaperWeekly 是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可.

  • 博客(5464)
  • 收藏
  • 关注

转载 精度飙升13.7%!复旦发布CAD参数化新基准,PHT-CAD框架精准解析工程图纸

在评测方面,现有的草图参数化方法使用的评估指标并不一致。此外,为了定量评估几何图层和标注图层关联的准确性,本文引入了一项新的评价指标——尺寸精度(Dimension Accuracy, DA),用于评估预测尺寸与其对应的真实标注之间的对齐情况。在模型训练方面,本文提出了渐进式分层调优(Progressive Hierarchical Tuning, PHT)策略,旨在逐步提升 PHT-CAD 的能力,使其不仅能更精准地感知单个图元,还能有效地推断出结构约束,并将标注层与对应的几何表示进行精准对齐。

2025-04-02 13:31:56 21

转载 ICLR 2025 | 高效又稳定!人大团队提出模型剪枝新方法LLM-Streamline

此外,团队发现使用准确度来衡量剪枝模型性能的方法有一定局限性,因此,又提出了一个新的指标——稳定性,来衡量剪枝模型的性能。已有的结构化剪枝方法主要在宽度层面进行剪枝,亦即对隐藏状态大小、注意力头数或注意力维度进行剪枝,但这些方法剪枝出来的模型是不能直接部署的,需要用各个方法自己专用的框架来加载。模型剪枝是一类重要而且应用广泛的模型压缩方法,其通过移除神经网络中的冗余的结构或权重,在尽量保持模型准确度的前提下减少模型的大小,提高模型的计算速度。该方法通过判断模型层的重要性,并剪去不重要的层来降低模型参数量。

2025-04-02 13:31:56 30

原创 从CoT到MCoT!NUS、港中文等发布「多模态思维链」重磅综述,280篇文献深度解析

MCoT 则突破这一限制,支持多模态数据的自由组合与协同推理。例如,技术路径包括从视频中提取代表性帧,结合时序推理生成答案,或将长视频任务拆解为短片段分析,提升复杂场景下的推理能力。:采用“关键帧提取 → 病变定位 → 知识库检索 → 结构化报告生成”的步骤,MCoT 能够从视频数据中提取关键信息并结合外部知识,输出精准的诊断结果,助力临床决策。:通过“目标检测→自然语言指令解析→路径规划”的协同过程,整合视觉、语言等多种信息,实现安全高效的驾驶决策,展现 MCoT 在实时系统中的应用潜力。

2025-04-02 13:31:56 716

转载 惨了!中科院分区表出炉后,博士的一区TOP秒变二区

A:由大牛导师一对一辅导,不录用退款,报名前需要由导师审核,填写咨询单后,会有大牛导师和你Meeting,不同的分区价格不同,咨询师会根据你的情况给你做详细的介绍,以及如何帮助你达到你的目标。开始正式辅导时 ,会把助教老师和辅导老师拉倒群里,辅导期间为了更好的沟通,我们不限制群里答疑次数,有问题随时可以群里跟老师交流,并且助教老师全程跟踪进度,避免进度延误。只要能把大佬的思路和方法执行到位,就相当于,在用大佬的经验做自己的科研和文章。早半年发出论文,你收获的不仅是顺利毕业的通行证,更是学术履历的黄金跳板。

2025-04-01 13:09:12 28

转载 ICLR 2025 | IDEA、清北等提出ChartMoE:探究下游任务中多样化对齐MoE的表征和知识

获取到数据后,ChartMoE 采用 chart-to-table、chart-to-json、chart-to-code 三种方式进行图文对齐,每个任务分别训练一个独立的 MLP Connector,拼上初始的通用 MLLM 中的 MLP Connector,再加上一个随机初始化的 learnable router,就可以构成一个亟待吃下 SFT 数据的 MoE Connector,即:Diversely Aligned MoE。这会让我们有更好的预期:比如加入通用数据后,通用能力不掉!

2025-04-01 13:09:12 18

转载 北京内推 | 腾讯微信事业群招聘视觉内容理解研究型实习生

负责搭建和运营微信生态体系,为全球超过13亿用户提供便捷的社交生活方式,也为各行各业的智慧化升级提供解决方案和连接能力。事业群所负责的业务包含而不限于:微信基础通讯、公众号、小程序、视频号、微信支付、企业微信、微信搜索、微信游戏、QQ邮箱、微信读书、微信键盘、秒剪等产品或功能。26届应届硕士 / 博士(2025年9月后毕业)/日常实习生(每周3天以上,持续6个月+)聚焦人工智能领域的招聘平台,涵盖高校硕博招生、博士后招募、企业校招、社招、实习和内推等。,请联系我们的栏目负责人(微信:pwbot02)。

2025-04-01 13:09:12 53

原创 视觉Token无缝对齐大语言模型词表!基于LLM实现高保真自回归图像生成

结构性与特征分布性的双重割裂,暴露了当前自回归视觉生成的重大缺陷:缺乏能够既保证高保真图像重建,又能与预训练 LLMs 词汇表在结构上和特征分布上统一的视觉 tokenizer。端到端自回归视觉生成。最新开源的 V²Flow tokenizer,首次实现了将视觉内容直接嵌入现有大语言模型的词汇空间,在保证高质量视觉重建的同时从根本上解决模态对齐问题。因此,一个核心问题是:能否设计一种视觉 tokenizer,使生成的离散视觉 token 在保证高质量视觉重建的同时,与预训练 LLMs 词汇表实现无缝融合?

2025-04-01 13:09:12 587

转载 全额奖学金+顶尖导师!香港科技大学(广州)物联网学域2025/26博士项目开放申请

下设的信息枢纽所建立的物联网学域,依托于香港科技大学在无线通信与网络领域世界领先的教学和科研优势,将进一步推动中国成为物联网领域的全球领导者。本学域所有老师均招收 2025 Fall,2026 Spring,2026 Fall 入学的博士生,此外,也招收科研助理,实习生,访问学生。采用融合学科教学法,教授学生跨学科的综合知识,鼓励学生追求创新,探索新的研究领域,打造以物联网赋能的智慧城市和数字化社会。全日制:3年(有相关研究型硕士学位)/ 4年(无相关研究型硕士学位),非全日制:6年。

2025-03-31 13:24:48 45

转载 科研“读、算、做”全流程智能化升级!玻尔科研空间站正式发布

依托在交叉学科领域的深耕,构建了“深势·宇知”AI for Science大模型体系,并进一步解决科学研究和工业研发领域的关键问题,将众多学科的科研方法从“实验试错 / 计算机”时代带入了“预训练模型时代”,形成了AI for Science的“创新-落地”链路和开放生态,构建了基于AI for Science的微尺度工业基础设施,赋能“千行百业”,为人类经济发展最基础的生物医药、能源、材料和信息科学与工程研究打造新一代工业研发系统。科研工具,全面覆盖文献调研、干湿实验、数据分析、科研绘图等场景。

2025-03-31 13:24:48 47

原创 港中大(深圳)、华为云联合突破!首次提出GraphRAG统一框架

RAG 技术显著提高了 LLM 在所有数据集上的性能,基于图的 RAG 方法通常比 Vanila RAG 具有更高的准确性。首先,提出了一个新的统一框架,可以涵盖所有现有的基于图的 RAG 方法。已有的基于图的 RAG 方法,如 RAPTOR、KGP、HippoRAG 等,但这些方法缺乏系统的比较和分析。总有一些你不认识的人,知道你想知道的东西。:提供了一个标准化的方法来评估基于图的 RAG 方法,确保了可重复性,促进了公平的基准测试,并为未来的 RAG 基础 LLM 应用的创新提供了便利。

2025-03-30 20:33:02 292

转载 CVPR 2025高分论文!从照片重建3D矢量,告别模糊渲染,重建边缘更清晰

因此,本研究提出了一种介于离散和连续之间的三维混合表示方法,在可微渲染的框架下结合矢量图形和概率建模,利用矢量表达的灵活高效性以更少的图元数量实现更精确的几何和边界建模,为 3D 场景表示提供了一种新的解决方案。随后,3D Gaussian Splatting (3DGS) 通过显式的高斯点云表示,提高了渲染效率和准确性,并利用连续的高斯分布实现了灵活的表征优化,适用于复杂场景的建模。然而,这些方法在处理物体的锐利边缘时仍然存在局限性,尤其是在近距离观察时,由于渐变分布的叠加容易出现模糊或过渡不清的现象。

2025-03-30 20:33:02 42

原创 初探最大更新参数化muP:超参数的跨模型尺度迁移规律

(注:这里 Muon 的结论是对的,但它不满足条件(14),因为式(14)要细说的话还依赖于一个更新量是 Element-wise 的假设,而 Muon 不符合这个假设,所以实际上不可用。这个结论也可以理解为“激活函数的影响是模型尺度无关的”,所以如果我们只想分析模型尺度的效应,那么可以忽略(Element-wise 的)激活函数的存在,由 LeCun 初始化直接得到缩放规律。最后的结论表明,如果我们直接将小模型的学习率用于大模型,那么对于足够大的模型,它的每一步损失增量就会随着参数尺度(即。

2025-03-30 20:33:02 638

转载 北京内推 | 中国电信人工智能研究院招聘大模型/AI安全等方向算法研究员/实习生

TeleAI 面向国家战略需求和人工智能发展趋势,结合中国电信在算力、数据、应用场景等多方面的优势,围绕大模型、AIGC、具身智能、AI Infra、智传网、AI基础前沿理论等方向开展基础研究、技术攻关和应用落地。3. 结合自有产品和业务需求,从 prompt优化、生成模型研发、adapter研发,性能加速等方面优化Α绘画,AI文字生成,Al视频生成等效果和体验,解决面向业务场景的应用和落地时的算法卡点问题;本科及以上学历,计算机科学与技术、人工智能、计算机、机器学习、大数据、数学等相关专业。

2025-03-30 20:33:02 241

转载 最近,大模型岗位彻底爆了……

是指运行一段具有特定功能的代码块的行为,以增强其处理能力,实现更复杂的任务,使大模型能够集成外部工具和资源,提升交互性和实用性。AI大模型技术实战—— Transformer 架构的 核心原理、应用 Fine-tuning 技术,精准微调AI大模型,!制造、医疗、金融等各行业都在加速AI应用落地,未来企业更看重能用AI大模型技术重构业务流的技术人。老师们将大模型技术原理讲透的同时,还将丰富的商业化AI应用项目无偿分享,帮大家快速打通。课程开班58期,已为20000+学员服务,口碑爆棚,从!

2025-03-29 12:37:30 45

原创 揭开RAG安全面纱,SafeRAG带你一览RAG Pipeline中潜在的脆弱性

在冲突、毒性和拒答任务中,有多少攻击关键词(例如,导致上下文冲突的矛盾事实、无缝嵌入的软广关键词以及拒答信号)成功出现在最终的响应文本中,即,攻击成功率(ASR),可直接用于评估生成器的安全性。因此,在 SafeRAG 中,作者首次细化了手动构建冲突的规则,确保生成的攻击尽可能合理且有效。所示,当噪声比例增加时,在检索到的上下文或过滤后的上下文注入噪声的检索准确率(RA)明显比在知识库中注入时的高,因为注入到知识库的噪声大约有 50% 的概率不会被检索到(Fig.5-

2025-03-29 12:37:30 747

转载 ICLR 2025 | 突破深度学习求解PDE的瓶颈,清华提出空间调控新范式GridMix

尤其是神经场(Implicit Neural Representations,INRs),凭借其连续参数化的特性,能够实现跨几何形态的高分辨率建模,在复杂场景下展现出卓越的精度和灵活性。空间调控引入的位置相关的调控参数虽擅长捕捉局部信息,却难以在稀疏 / 不规则的空间域中建模全局结构,导致未知区域重建质量骤降(如图 3 所示),从而严重制约跨空间域的泛化能力 —— 而这正是鲁棒 PDE 建模的关键要求。正如先前的研究所展示的,全局调控无法捕捉局部细节,因为调控参数的任何变化都会导致重构函数的全局扰动。

2025-03-29 12:37:30 39

转载 北京内推 | 微软AI DKI团队招聘大语言模型方向应用研究实习生

聚焦人工智能领域的招聘平台,涵盖高校硕博招生、博士后招募、企业校招、社招、实习和内推等。编程/算法/动手能力强,熟悉python,思维活跃,勤奋踏实,具备快速学习能力;2. 有机器学习、自然语言处理、软件工程等领域国际顶会顶刊论文发表者优先;3. 利用LLM与Coding Agent进行问题代码的定位与修复。致力于人工智能、数据分析、智能决策、软件工程的研究。目前已有百度、阿里、腾讯、字节跳动等企业发布内推岗位,扫描下方小助手的微信,pick 你心仪的岗位~为了更好地了解和满足大家的需求,我们建立了。

2025-03-28 13:32:03 45

转载 从深度学习到科学模拟,A5000显卡成算法工程师新宠,这背后有何技术乾坤?

显存方面,A5000 带宽为 768 GB/s,稍逊于 3090 的 936 GB/s,但差距仅为 18%,且两者显存大小均为 24GB,能满足常态需求。对于线性回归、主成分分析等常涉矩阵操作的算法,运算效率直线上升,助力算法工程师更快迭代模型,搭配镜像和网路加速功可满足更多应用场景。一键分享,专属链接或二维码秒生成,再通过自己的渠道拉新客注册使用。总体而言,A5000 性价比确实吊打 3090,它让更多人能够以相对较低的成本,享受到高端算力带来的便捷与高效,是追求极致效率和性能的算法工程师的理想之选。

2025-03-28 13:32:03 40

转载 7倍推理加速!清华团队发布稀疏Attention,无需训练加速一切模型

下表展示了 SpargeAttn 在各模型上的稀疏度,Attention 速度,以及各任务上的端到端精度,可以发现 SpargeAttn 在保证了加速的同时没有影响模型精度:(注:此论文中的所有实验都是基于 SageAttention 实现,目前 Github 仓库中已有基于 SageAttention2 的实现,进一步提供了 30% 的加速。Attention 虽然具备稀疏性质,但是其稀疏形状在不同的模型甚至同一模型的不同层中都是不同的,体现出很强的动态性。总有一些你不认识的人,知道你想知道的东西。

2025-03-28 13:32:03 33

原创 CVPR 2025 | 南大提出DUCT方法:用双重知识巩固抵抗持续学习中的灾难性遗忘

考虑到在 exemplar-free 的设定下,无法存储旧任务的训练样本,因此需要找到新的方法来调整旧分类器,使其适应新的嵌入空间。然而,传统的深度学习方法在学习新领域时,模型的嵌入空间(embedding)和分类器(classifier)往往会过度偏向最新领域的数据,导致对之前学到的知识产生遗忘。对应了采取均匀的任务向量融合策略下的模型表现(不考虑任务间相似度信息),可以发现引入表征空间的整合过程后,模型性能大幅提升,这验证了在 DIL 任务中采用统一的表征空间这一做法的优越性。

2025-03-28 13:32:03 751

转载 AIGC领域新革命!浙大团队最新综述全面解析「4D生成」核心技术与挑战

在 2D、视频以及 3D 内容生成领域快速发展的基础上,4D 生成作为一个新颖且快速发展的研究领域逐渐兴起,并吸引了越来越多的关注。扩散模型已经在 2D、视频乃至 3D 内容生成方面取得了巨大成功,而现在,研究人员的目光已转向 4D 生成,通过多样化的控制条件生成时空一致性 4D 资产。我们系统梳理了当前 4D 生成的方法,包含其基础表征、 主要优化方式、控制条件以及主要解决的 4D 生成挑战(一致性、可控性、多样性、高效性、忠实性)。我们总结了生成 4D 资产的两种方法:基于推理的方法和基于优化的方法。

2025-03-27 22:03:30 22

原创 大模型融合新思路!港城大、华为等提出UniTE,显著提升LLM集成效率和性能

在我们对 100 个随机选择的 NQ 和 TriviaQA 响应的分析中,Blender 在约 80% 和 70% 的情况下分别将较长的响应作为答案,这可能与其训练数据的特征有关。为此,我们选择了四个在某些数据集上表现相似但词汇表大小不同的模型,即 LLaMA2-13B(词汇大小:32,000)、Mistral-7B(词汇大小:32,768)、Yi-6B(词汇大小:64,000)和 DeepSeek-LLM-7B(词汇大小:102,400)。给定一组基础模型(LLMs),每个模型都有独立的分词器和词汇表。

2025-03-27 22:03:30 636

转载 ACM MM25地面卫星匹配大赛来袭!恶劣天气下的定位挑战,天空之眼助力精准导航

研讨会将涵盖与无人机多媒体相关的各种主题,包括航拍图像和视频处理、无人机数据分析的机器学习、无人机群技术以及基于无人机的多媒体应用。通过专注于部分视图,我们的目标是更准确地反映现实世界中的场景,在这些场景中,障碍物或有限的传感器角度可能会限制视野,例如在低空无人机导航、搜索和救援任务和自主飞行期间。提交的内容应该是单盲的,用英文撰写,并根据当前的 ACM 两栏会议格式进行格式化。总的来说,本次研讨会将提供一个独特的机会来探索令人兴奋和快速发展的无人机多媒体领域及其对更广泛的多媒体社区的潜在影响。

2025-03-27 22:03:30 50

原创 NeurIPS 2024 | 交互式聚类:探索以较小的交互成本,突破聚类性能瓶颈

在用户交互阶段,对于给定的预训练聚类模型,从困难度、代表性和多样性三个角度,挑选出高价值样本,再向用户询问这些样本相对于其最近的若干个聚类中心的隶属关系。在模型优化阶段,依据用户的正/负反馈,使用相应的损失函数对聚类模型进行微调,同时对高置信度的样本采用规范化损失函数,来避免模型过拟合交互样本。因此,在挑选高价值样本时,应该优先考虑位于高密度区域的样本。提出在聚类过程中引入用户交互,通过询问少量高价值样本的类别从属关系,有效缓解了现有内部驱动的聚类方法面临的难样本问题,以较小的交互成本突破了聚类性能瓶颈。

2025-03-27 22:03:30 598

原创 顶刊TPAMI 2025!南大、南洋理工联合提出PROOF:基于视觉语言模型的持续学习新范式

面对新任务时,在冻结旧投影层的基础上扩展新的投影层,从而保留先前的知识。然而,最近的研究工作发现,在视觉语言模型(VLM)中,视觉特征和文本特征之间存在固有的分布差异。类别增量学习(CIL)或持续学习是智能系统在现实场景中亟需的关键能力,要求模型在持续学习新任务的同时保持原有知识的完整性。在这个不断变化的世界中,训练数据通常以流的形式出现,其中新类别的数据不断涌现,这要求学习系统能够持续学习它们。然而,由于 CLIP 具有零样本能力,本文也可以评估“未见”类别的性能,以研究零样本性能的变化。

2025-03-26 17:10:47 488

转载 阿里高德、中科院推出VMBench:感知对齐的视频运动生成全新基准

从表 1 可以看出,在运动平滑度(MSS)评估方面,即便是先进的指标,如 AMT(18.1%)和 Warping Error(-19.1%),在面对复杂形变时仍然表现出有限的区分能力,并产生了违反直觉的评估结果。为了提供更丰富的运动类型,我们构建了 MMPG-set(Meta-Guided Motion Prompt Generation 数据集),该数据集涵盖 六种运动模式,共 1,050 个运动提示(prompts),用于评估模型的运动生成能力。(b)我们提出的用于评估视频运动的指标框架。

2025-03-26 17:10:47 53

转载 北京内推 | 360 AI Research团队招聘视觉AIGC方向研究型实习生

是360集团在AI方向的核心技术团队,我们以”多模态+跨模态“为主要研究方向,以“大模型+zero/few shot"为主要研发范式,在中文图文跨模态学习、开放世界目标检测、开放词表视频分析、AIGC图像生成以及多模态大模型等领域展开研究,技术能力面向集团所有业务输出,提供互联网信息分发、企业数字化、AIoT等 360 集团全量业务场景支持,支持千万级硬件设备,每日服务亿级用户。2.业内顶级的大模型学术+业务团队,组内轻松,自由,学术氛围浓厚,实习同学均会有专门的师兄帮助和带领。最新的招聘信息也不知道?

2025-03-26 17:10:47 184

原创 编辑一切知识!大模型编辑新范式AnyEdit,有效突破知识边界

得益于这一机制,AnyEdit 能够简单有效地实现知识编辑长度的自适应(动态确定所需编辑的令牌数量),并且通用性强,能够高效支持代码、诗歌、数学推导等多样化的任意形式知识编辑任务,从而突破了传统单令牌编辑方法的效能瓶颈。现有模型编辑方法面临的核心问题在于单令牌编辑的效能壁垒:长文本知识通常包含多个关键令牌,且隐状态之间存在复杂的依赖关系,仅通过修改单个令牌隐状态(如图 1(a)中的步骤 2)难以保证整体知识的完整性与一致性。换言之,单令牌编辑引起的低概率偏移成为有效更新长文本知识的内在限制。

2025-03-26 17:10:47 465

转载 埃默里大学、UT Austin联合提出Spatial-RAG:开启空间智能问答的新时代

▲ 图3. Spatial-RAG 运行方式的示例:给定一个问题,1)稀疏空间检索:LLM 将自然语言问题解析为空间数据库的空间 SQL 查询,检索满足空间约束和稀疏空间相关性分数的空间对象。如图 2 sparse spatial retrieval(稀疏空间检索)所示,通过将输入的自然语言问题解析为空间 SQL 查询来实现这一点,该查询将在空间数据库上执行,以高效地从数据库中检索相关的空间对象。具体来说,为了识别空间相关的候选答案,研究人员提出了一种新颖的空间混合检索模块,结合了稀疏和密集检索器。

2025-03-25 13:11:13 38

原创 大模型在简单物理现象理解任务上的认知困境:联想能力将是AGI之路上的下一个关键?

为评估大型语言模型在自然语言知识掌握方面的充分性重,研究者要求大模型生成物理概念的描述,包括其核心属性和示例。随着大模型能力的迭代演进,過往评测基准的局限性逐渐显现。第二种是基于网格化抽象表示的概念理解子任务,由于网格化的表示可以有效剥离语言模型的记忆优势,因此它可以用来评估智能体对概念的高层次理解能力比如抽象和联想能力(高层次理解)。为了评估大模型能否通过现实图片识别物理概念,研究者在谷歌图片搜索中选取反映目标概念核心属性及示例的图片(共 100 张),并构建与文本任务相同的四选一选择题。

2025-03-25 13:11:13 894

转载 世界首个!性能超扩散模型256%,推理快21.8倍,Uni-3DAR用自回归统一微观与宏观的3D世界

实验结果显示,在生成任务中,Uni-3DAR 的性能大幅超过了扩散模型方法;综上,该方法充分利用了 3D 结构固有的稀疏性,通过八叉树分解、精细 token 化与二级子树压缩,不仅大幅降低了数据表示的复杂度,而且实现了从微观到宏观 3D 结构的统一表示,为后续自回归生成与理解任务提供了高效、通用的数据基础。为此,Uni-3DAR 提出了一种层次化、由粗到细的 token 化方法,实现了数据的高效压缩和统一表示,既适用于微观也适用于宏观 3D 结构建模,为后续的自回归生成与理解任务提供了坚实基础。

2025-03-25 13:11:13 48

转载 CVPR 2025高分论文!单图1秒变3D真人,全新方法IDOL解决数字人重建问题

文本提示与图像生成:利用先进的文本到图像生成模型(如 Flux),设计描述性提示语,确保在“区域、服饰、体型、年龄、性别”等维度上实现均衡采样,从而生成 10 万张高质量全身人体图像(经过人工筛选,保留 90K 张合成图像,并融合 10K 张真实图像)。多视角图像生成:基于生成的全身图像,通过训练多视角视频生成模型(MVChamp),再结合 SMPL-X 人体模板进行姿态拟合,获得 24 个均匀分布的视角图像,确保数据在 3D 一致性上的准确性。此外,由于表达方式的限制,这些方法往往难以泛化到新的姿态。

2025-03-24 20:48:39 98

转载 GPT-4.5刚出来就被攻破了?成功率破90%, MBZUAI团队出品

以下两张表格是跟之前 state-of-the-art 性能比较,具体来看,当扰动预算 ε 为 16 时,该方法在 GPT-4.5 上达到了惊人的 95% 的攻击成功率,相比当前最好的方法提高了一倍以上,而在 GPT-4o 上的成功率也同样达到 95%,较传统的攻击方法提升了近两倍。,针对当前最先进的商业视觉语言大模型的漏洞,提出了一种令人意外简单却高效的攻击基准,成功地在刚刚发布不久的 GPT-4.5,以及之前的 GPT-4o、o1 等模型上实现了超过 90% 的攻击成功率。

2025-03-24 20:48:39 49

转载 上海内推 | 上海算法创新研究院大模型中心算法团队招聘大模型算法实习生

团队成员来自普林斯顿、北京大学、上海交大等著名学府,主要从从事大模型预训练、增强相关的算法工作。团队拥有足够多的算力和研究氛围,围绕模型架构、训练、数据合成等方向进行深入的探讨。1. 有顶会的发表经验,在大模型的数据合成(增强)领域、RAG、强化学习方向有较深的积累;2. 有较强的代码能力,对常规的大模型训练框架、微调框架或强化学习框架有一定的熟悉程度;聚焦人工智能领域的招聘平台,涵盖高校硕博招生、博士后招募、企业校招、社招、实习和内推等。3. 算力资源有保障,能够有足够的算力探索要做的事情;

2025-03-24 20:48:39 55

原创 什么样的图像才是好的图像?近200篇文献总结图像质量检测的最新进展与挑战

当图像质量在 IQA 模块中获得好的评估结果时,这可能只是由于图像符合基于 ViT 的 IQA 方法的评估偏好,而非图像本身质量高——也就是说在整个系统里,生成图像的模块在 IQA 方法给出的一次次评分中,学到的只是一种 IQA 方法的评估规律,而非图像质量本身。总之,想要提出一种所有场景都适用的 IQA 方法是不现实的,很多场景对高质量的定义完全相反:举例来说,运动模糊可以增强图像的真实感,在一些情况下可以满足人像拍摄的要求,属于高质量图像,但对用于医学诊断的图像来说,则是低质量的图像。

2025-03-24 20:48:39 803

转载 北京/杭州/上海内推 | 阿里通义实验室招聘大模型方向研究型实习生

招聘研究型实习生,面向下一代RAG技术如Deep Research相关进行基础研究,团队近几年在顶级会议ACL/EMNLP/NAACL/ICLR等发表50+篇论文,登顶多项榜单,在SemEval 22/23连续两次获得最佳论文奖,并在ACL 2023/NLPCC 2024分别获得杰出论文奖。聚焦人工智能领域的招聘平台,涵盖高校硕博招生、博士后招募、企业校招、社招、实习和内推等。目前已有百度、阿里、腾讯、字节跳动等企业发布内推岗位,扫描下方小助手的微信,pick 你心仪的岗位~5. 知识幻觉检测&优化。

2025-03-21 12:37:54 79

原创 打破自回归模型的“速度枷锁”!NYU、宾大等发布「推测解码技术」最新综述

Speculative RAG 则通过微调的专家语言模型生成完整的答案草稿,并通过聚类检索到的文档生成多样化的草稿,使用自一致性评分和自反思评分代替逐词验证,从而提高生成效率。在这一背景下,如何在保持高质量输出的同时,显著提升模型的推理速度,以满足实时应用的需求,成为了一个亟待解决的挑战。SD 通过引入草稿模型并行生成 Token,并利用目标模型进行验证,打破了传统自回归模型的序列依赖性,显著降低了推理延迟,同时保持了高质量的输出。在探索如何高效生成语言模型输出的过程中,研究者们提出了多种创新方法。

2025-03-21 12:37:54 571

转载 AAAI 2025 | 复旦等提出SMART:用于密集知识型任务的多智能体联调框架

SMART 包括:意图重建器(从各种指令中澄清知识意图)、知识检索器(访问外部知识)、事实定位器(评估检索到的知识,并从相关文档中识别事实片段)、响应生成器(忠实地利用事实,并在有事实的情况下进行引用)。如表所示,短轨迹学习和长轨迹学习可以带来巨大的性能提升,总体而言,长短轨迹学习的组合方法可产生最佳性能,凸显了协作和独特性的重要性。在该设置中,使用长轨迹子集的 60k 个样本进行长轨迹学习,训练四种不同的框架,以评估智能体缺失对框架性能的影响。因此,应在确保协同效应的同时,优化个体智能体的贡献。

2025-03-21 12:37:54 55

转载 录用率仅22%!如何看待CVPR 2025的审稿结果?

作为计算机视觉领域的顶级盛会,CVPR堪称论文界的“奥斯卡”,每一篇被录用的论文都代表着行业前沿的方向,引领着技术的发展。今年的竞争异常激烈,共收到13008份投稿,最终仅有2878篇被录用,录取率仅为22.1%。从选题辅导、文献阅读、文献翻译&润色、创新点评估、期刊推荐、AutoML全面辅助科研流程,提供专业的科研背景提升、留学申请、作业辅导、基金申请、科研立项等服务;科研0基础课程、AI入门算法基础课程、AI前沿论文带读课程。上周,CVPR 2025的论文接收结果正式公布!QS top100博士。

2025-03-20 12:37:44 72

转载 AI Agent真的安全吗?南洋理工最新综述揭秘LLM Agent安全风险与防御策略

外部可信度关注与 Agent 系统交互的外部模块的可信度。在 TrustAgent Survey 的定义中,Agent 系统是一个具有类人认知的独立实体,由具有记忆的大脑和工具形式的行为组成。通过深入研究和总结新出现的针对代理和多智能体系统的攻击、防御和评估方法,TrustAgent Survey 将可信 LLM 的概念扩展到可信 Agent 的新兴范式。:将 LLM 可信度的维度扩展到单代理和 MAS 的上下文中,具体分为安全性、隐私性、真实性、公平性和鲁棒性,并引用了所有这些维度的现有工作。

2025-03-20 12:37:44 98

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除