
ACL论文分享
文章平均质量分 58
五阿哥爱跳舞
零散知识记录,分享投稿全流程经验;小红薯同名
展开
-
ReFT: reasoning with reinforced Fine-Tuning
用influence function来衡量新增一条数据对于模型训练的整体的影响。对比随即筛选和reward model筛选(开源的,用于对齐人类便好)。从一个question中看到多种多样的cot,都可以从中学习。思考增加或者减少一条数据,对于模型训练的影响。高质量的数据能够对主题产生正向的支持/反对。高质量的数据能够对模型产生正向的影响。使用最后一层MLP的梯度,聚类找出。数据的质量是模型自己来定义的。原创 2024-08-20 20:56:21 · 473 阅读 · 0 评论 -
计算机顶会论文检索途径和方法
计算语言协会有一个专门的网站,ACL系列的论文都会包括在其中,如果检索自然语言相关的论文,可以直接来ACL当中通过关键词检索就可以了。点击click to fetch all获取本次会议所有论文的标题,然后根据ctrl+f,利用浏览器根据标题检索论文即可。进入网站之后,选择会议以及会议年份,会显示每一年的官方网站,或者直接有论文列表。网址中会有会议年份选择和论文列表选择,进入论文列表之后直接根据关键词检索即可。如果没有论文列表,则考虑进入此页面中的会议官方网址,选中对应会议,进入检索论文即可。原创 2024-07-17 16:31:48 · 7050 阅读 · 0 评论 -
小红书2024LLM论文分享
什么样子的模型是强模型?是一个直观比较的结果:Acc在这个任务上越好,则认为它越强。随着各大机构的模型越来越强,评估任务越来越复杂,如何在未来更加复杂的任务下评估LLM的能力。原创 2024-06-27 20:35:06 · 519 阅读 · 0 评论 -
Workshop on Argument Mining (ArgMining) 历届会议信息
论点挖掘,作为一个自然语言处理当中的重要任务,伴随着各大NLP顶会已经组织了11届workshop(2024年第11届跟随着ACL2024主会开办)原创 2024-06-11 15:18:26 · 1037 阅读 · 0 评论 -
ACL文献分享:DiaASQ : A Benchmark of Conversational Aspect-based Sentiment Quadruple Analysis
Aspect-based sentiment analysis (ABSA) 是一种细粒度的情感分析方法,旨在确定文本中不同方面的情感。具体来说,它不仅识别出文本的整体情感(如正面或负面),还识别出针对特定方面或属性的情感。例如,在一篇关于手机的评论中,ABSA 可以识别出用户对电池续航、屏幕质量、价格等不同方面的情感态度。ABSA 的应用非常广泛,可以用于产品评论分析、客户反馈分析、社交媒体监控等领域,帮助企业更好地理解客户对不同产品或服务方面的满意度和不满之处,从而做出更有针对性的改进。原创 2024-05-23 19:49:36 · 423 阅读 · 0 评论 -
ACL论文分享:从零开始生成多模态共情回复
王培东:多模态大模型的架构与训练。原创 2024-05-22 18:45:07 · 341 阅读 · 1 评论