12、认知可信表征与伦理考量

认知可信表征与伦理考量

1. 迈向认知可信表征

当前对于认知可信表征的研究,需超越静态概念知识,以更好捕捉动词和副词的表征动态及其在程序处理中的作用。例如,观察用户在受控环境中的行为,可用于改进模型生成的指令消息;反之,用户也会根据观察到的多模态行为调整对模型的指令。

在多模态场景中,眼动追踪数据可作为人类注意力的代理,用于研究人类如何选择性地关注视觉线索,并将其无缝整合到联合解释中。相关研究如下:
- 图像描述生成 :研究人员记录参与者为屏幕上图像生成字幕时的眼动情况,并将这些眼动追踪信息添加到字幕生成模型的内部表征中,从而使图像描述更加自然和多样化。
- 视觉问答任务 :多模态模型的注意力与人类注视模式之间的高相关性,是视觉问答任务性能的重要预测指标,表明模型可从认知可信表征中受益。
- 信息检索 :整合注视信息有助于确定文档的相关性,但关键在于识别合适的表征合并操作。目前,这些特定任务的发现能否推广到更广泛的场景,仍是一个有待研究的问题。

2. 认知基础

在自然语言处理的多模态模型中,通常是将文本和视觉模态相结合。认知驱动的方法则提议将认知信号作为额外的模态,并重新利用现有的多模态架构。不过,认知数据的计算建模研究仍处于早期发展阶段。

2.1 信号融合
  • 早期融合 :分别获取每种模态的表征,然后直接将它们连接起来,作为神经模型的输入表征。例如,用眼动追踪特征的向量表征增强句子的语言模型表征,可提高实体识别、词性标注、
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值