- 博客(8)
- 收藏
- 关注
原创 论文阅读笔记 —— 捕获模态独特知识和模态共享知识(对比模态解耦学习CMDL)
Warning!!!本文仅为个人笔记,可能会有错漏,仅供参考。图片与公式均来自论文原文。论文:《Contrastive Modality-Disentangled Learning for Multimodal Recommendation》
2025-03-19 14:39:18
1582
3
原创 论文阅读笔记 —— 基于扩散模型生成具有同理心的对话回应
Warning!!!本文仅为个人笔记,可能会有错漏,仅供参考。图片与公式均来自论文原文。论文:《DIFFUSEMP: A Diffusion Model-Based Framework with Multi-Grained Control for Empathetic Response Generation》
2025-03-18 16:08:13
800
1
原创 论文阅读笔记 —— 为文档级EAE设计检索策略
(3)最后使用高斯采样策略生成k个伪演示,即自适应混合检索从这些离散示例的相邻语义区域中采样伪示例,这些伪示例既保留了上下文语义的一致性,又符合事件模式。(1)从训练集中检索出与输入文档最相似的前k个文档作为离散演示,即检索到的离散示例文档和标签分别与输入文档和目标标签相似。:由于文档级EAE的复杂性,相似的上下文很难总具有相同的事件标签,可能导致检索到的内容在事件模式上与输入文档存在偏差。具体来说,使用S-BERT计算输入文档与训练集中所有文档的语义相似性,检索出与输入文档最相似的前k个文档作为演示。
2025-03-10 20:20:58
640
1
原创 论文阅读笔记 —— 为EAE任务选择最优的上下文示例
1、TISE的编码器选择较为基础(基础的BERT模型),且当前的优化方法(如使用排名标签作为监督信号)无法充分发挥EAE任务的潜力。针对的是不同示例ti和tj之间的分析,目标是避免选择语义重叠的示例,保证选择的示例集合具有多样性。代码模仿提示通过结构化的方式表达任务的输入、输出和要求,并通过上下文示例提供丰富的语义信息,帮助 LLM 更好地理解和推理。并通过最大池化选择最相关的角色,具体来说,确保每个示例角色都能找到与之最相关的测试输入角色,从而最大化角色之间的相似性。具体来说,多个示例可。
2025-03-10 15:20:15
1035
1
原创 论文阅读笔记 —— 建模角色参数之间的依赖关系以获得更好的EAE效果
采用预训练的BART模型对上下文和角色进行编码,生成事件导向的上下文表示和上下文导向的角色表示。:通过检索模块检索当前事件的最相似事件,并使用检索到的事件内图来帮助构建事件间图,捕获不同事件间角色的依赖关系关于事件内依赖,使用训练集中的事件类型t的角色共现信息作为依赖权重。在检索模块中,用余弦相似度来检索与当前事件最相似的事件的事件内图,将当前事件与最相似事件在事件内图中对应的节点进行映射。与事件内图不同,事件间图捕获事件之间的依赖关系,因此它的节点和边对应于多个事件类型和角色,而不仅仅是单个事件类型。
2025-03-06 20:38:39
816
1
原创 论文阅读笔记 —— 以简单参数推理复杂参数的文档级EAE
从易到难”的文档级EAE(SREA)通过分析参数的难易程度,模拟人类的推理方式,从简单参数入手,逐步推理出复杂参数,从而提高模型抽取和推理能力。框架的三个核心模块:排序模块:根据当前上下文对参数角色进行信息推理,以帮助捕获困难参数的信息推理模块:根据推理路径进行信息推理,帮助捕获困难参数的信息。提取模块:利用推理模块完成参数提取。
2025-03-06 16:01:49
632
1
原创 论文阅读笔记 —— LLM提取结构化信息的方法
本文将语言模型的生成过程,定义为可控的状态转换,将生成过程和提取过程对齐,以保证输出结构的完整性,适应信息提取任务的目标。通过定义5个状态,以控制语言模型的生成过程,确保输出内容不仅符合语言模型的生成目标,还能满足结构化信息抽取任务的具体要求。(1)Start State(开始状态):标记生成过程的开始,模型输出结构化格式的初始字符(如 JSON 的 “ { ” )。(5)End State(结束状态):标记生成过程的结束,模型输出结构化格式的最终字符(如 JSON 的 “ } ” )。
2025-03-06 14:28:05
1119
1
原创 论文阅读笔记 —— 大模型水印方法RIW
原有的方法通过计算绿色列表文本的出现频率,与预期频率进行比较,若出现明显偏差则说明AI参与。论文中计算先验概率的方法是基于大量文本数据的自然频率,虽然直观,但可能无法完全捕捉到token在不同上下文的复杂分布。(1)对于G+中的token,增加其logits值,以提高其在生成文本中出现的频率。(2)对于G-中的token,减少其logits值,以降低其在生成文本中出现的频率。对每个子列表的逻辑进行不同的修改,确保一个敏感的嵌入过程,且对原始文本干扰最小。分子是实际频率和预期频率的偏差;
2025-03-05 14:41:16
696
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅