自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 预测LLM微调与遗忘副作用的新方法MNEME

大型语言模型(LLM)常通过微调或知识遗忘来适应新任务或消除不良行为。现有评估方法虽能衡量干预后的性能,却缺乏检测不可预测或涌现性副作用(如遗忘生物学内容导致化学任务性能下降)的通用方案。为此,我们提出MNEME(Model diffiNg for Evaluating Mechanistic Effects),一种轻量级框架,利用稀疏模型差分技术识别此类副作用。

2025-07-30 22:26:35 79

原创 TTS-1技术报告:基于Transformer的文本转语音模型

我们介绍了Inworld TTS-1,这是一组两个基于Transformer的自回归文本转语音(TTS)模型。我们最大的模型TTS-1-Max拥有88亿参数,专为要求苛刻的应用场景提供最高质量和表现力。TTS-1是我们最高效的模型,具有16亿参数,专为实时语音合成和边缘设备用例而构建。通过扩展训练计算量并应用语音语言模型(SpeechLM)组件的预训练、微调和RL对齐的序列化流程,这两个模型在各种基准测试中都实现了最先进的性能,仅依靠说话者语音的上下文学习就展现出卓越的质量。

2025-07-30 21:16:25 63

原创 RATE:基于LLM的检索增强生成技术提取管道

经RATE验证的技术术语被映射到共现网络中,揭示了研究领域的主题集群和结构特征。为评估效果,专家们人工标注了70篇随机选取文章中的技术术语作为黄金标准数据集,并采用基于BERT的技术提取模型作为对比方法。RATE取得91.27%的F1分数,显著优于BERT模型的53.73%。本文介绍了检索增强技术提取(RATE),一种基于大型语言模型(LLM)的从科学文献中自动提取技术的管道。我们的研究结果凸显了基于定义驱动的LLM方法在技术提取和映射方面的潜力,同时为BCI-XR领域的新兴趋势提供了新见解。

2025-07-30 20:06:22 138

原创 计算机视觉的未来方向:无监督学习与生成模型

欧洲计算机视觉会议(ECCV)于周日开幕,与国际计算机视觉会议(ICCV)交替举办。原定今年在格拉斯哥举行的ECCV,与今年夏天大多数主要计算机科学会议一样,转为线上举行。

2025-07-30 19:18:44 88

原创 异质图自适应结构学习探索

图卷积网络(GCNs)在图表示学习领域获得广泛关注,近期研究重点聚焦于提升其在异质图上的性能以应对现实应用需求。典型消息传递范式中的局部特征聚合机制,阻碍了对同类别非局部节点间长程依赖关系的捕获。异质图固有的连接结构常与远距离同类别节点间的信息共享需求相冲突。我们提出在浅层GCN中通过结构学习重连边关系,以避免因过度平滑导致的下游判别任务性能退化。通过参数化邻接矩阵学习非局部节点间的连接,可扩展浅层GCN的跳跃范围从而捕获长程依赖。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-30 15:16:34 182

原创 RoD-TAL:罗马尼亚驾照考试问答基准

人工智能与法律系统的交叉领域对支持法律教育的工具需求日益增长,特别是在罗马尼亚等资源不足的语言环境中。本研究旨在通过文本和视觉问答任务,评估大语言模型(LLMs)和视觉语言模型(VLMs)对罗马尼亚驾驶法律的理解与推理能力。为此,我们提出了RoD-TAL——一个新颖的多模态数据集,包含罗马尼亚驾驶考试中的文本和图像类试题,并附带法律条款标注和人工解释。本研究揭示了LLMs/VLMs在法律教育应用中的潜力与局限性。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-30 14:12:30 107

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除