
Paper
文章平均质量分 85
Vincy_King
所有人都祝你快乐,我只愿你遍历山河,觉得人间值得。
展开
-
【阅读笔记】Graph of Thoughts: Solving Elaborate Problems with Large Language Models
作者介绍了Graph of Thought (GoT):一个具备提高LLM提示能力,超越了思维链或思维树 (ToT) 等范式提供的能力的框架。GoT的关键思想和主要优势是能够将LLM生成的信息建模为任意图,其中信息单位(“LLM思想”)是顶点,而边对应于这些顶点之间的依赖关系。这种方法能够将任意的LLM思想组合成协同结果,提炼出整个思想网络的本质,或者使用反馈循环来增强思想。作者说明了GoT在不同的任务上提供了比现有技术更好的优势,例如比ToT提高了62%的排序质量,同时降低了大于31%成本。原创 2023-09-03 00:38:51 · 4269 阅读 · 0 评论 -
【Eye】Fake News Reading on Social Media: An Eye-tracking Study
在网上传播假新闻(以及一般的虚假信息)最近被认为是威胁整个社会的一个主要问题。这种传播在很大程度上是由于新的媒体形式,即社交网络和在线媒体网站。研究人员和从业者一直试图通过描述假新闻并设计自动检测它们的方法来回答这个问题。到目前为止,这些检测方法的成功程度还很有限,这主要是由于新闻内容和上下文的复杂性,以及缺乏适当的注释数据集。提高自动错误信息检测方法效率的一种可能的方法是模仿人类的检测工作。在更广泛的处理假新闻传播的意义上,了解网络用户的新闻消费行为也很重要。原创 2023-02-28 10:09:52 · 741 阅读 · 1 评论 -
【Gaze】Generating Image Descriptions via Sequential Cross-Modal Alignment Guided by Human Gaze
当说话者描述一幅图像时,他们倾向于在提到物体之前先看它们。本文通过对图像描述生成过程的计算建模,研究了这种序列跨模态对齐。作者以一个SOTA的图像字幕系统作为出发点,利用人类注视信息设计不同模型变体。本文主要是提出了第一种生成图像描述的方法,其中视觉处理是按顺序建模的。经实验和分析证实,通过利用注视驱动的注意力,可以获得更好的描述,并通过比较将注视模式与语言产生对齐的不同方式,该方法在一定程度上来阐明人类的认知过程。作者发现,依次处理凝视数据会导致描述与说话者产生的描述更一致,更多样化、更自然——特别是当凝原创 2022-11-24 15:01:02 · 402 阅读 · 1 评论 -
【Eye-tracking】DIDEC: The Dutch Image Description and Eye-tracking Corpus
本文提供了一个荷兰语口语图像描述的语料库,结合两组眼球追踪数据:free viewing,参与者没有任何特定目的地观看图像,以及description viewing,我们跟踪眼球运动,同时参与者对他们正在观看的图像进行口头描述。本文描述了数据收集过程和语料库本身,并对图像描述中的自校正进行了初步分析,并发现了两个结果。description viewing的眼球追踪数据比free viewing任务更连贯;图像描述的变化(也称为)在不同语言之间只有适度的相关性。原创 2022-11-21 23:45:19 · 430 阅读 · 0 评论 -
【Image Text Matching】Learning Semantic Concepts and Order for Image and Sentence Matching
图像和句子匹配近年来取得了很大的进展,但由于视觉语义差异较大,仍然具有挑战性。这主要是由于像素级图像的表示通常缺乏其匹配句子中的高级语义信息。本文提出了一种语义增强的图像和句子匹配模型,该模型可以通过学习语义概念,然后按照正确的语义顺序组织它们来改进图像的表示。给定一个图像,本文首先使用多区域多标签CNN来预测其语义概念semantic concept,包括对象、属性、动作等。然后,考虑到不同的语义概念顺序导致不同的语义意义,使用上下文门控句子生成方案进行语义顺序学习。原创 2022-11-16 15:01:29 · 1395 阅读 · 0 评论 -
【Image Captioning】Improve Image Captioning by Estimating the Gazing Patterns from the Caption
CNN等神经网络模型中提取的图像特征中产生类人描述方面达到了良好的性能。然而,之前没有一种明确的方法能够反映人类对图像的感知,比如凝视模式。在本文中,作者假设在image caption中的名词(即实体)及其顺序反映了人类的凝视模式和感知。为此,作者从caption中的单词中预测注视序列gaze sequence,然后训练一个指针网络pointer network来学习在新图像中给定一组object后自动生成gaze sequence。原创 2022-11-16 14:51:25 · 377 阅读 · 0 评论 -
英刊里需要注意表达的内容
关于paper中一些需要注意的语法问题原创 2022-10-15 00:23:21 · 166 阅读 · 0 评论