自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Vincy_King

当地小有名气的机灵鬼

Vincy_King 优快云认证博客专家优快云认证企业博客

码龄7年

128: 原创

2万+: 周排名

190万+: 总排名

16万+: 访问

: 等级

1776: 积分

1917: 粉丝

181: 获赞

52: 评论

1500: 收藏

私信

关注

热门文章

分类专栏

最新评论

解决codeforces访问慢的问题
2301_80447886: 搞这个弄的我cf better没用了
【脑电数据处理】小波变换
Aiminminai: 您好我有一个疑问，就是您的方法可以把一段波形的αβθ波提取出来，意思就是这一段波是由以下这五种波形组合而成的，可实际情况是需要识别一段波是具体什么波，阿尔法还是θ，我按您的方法提取出了五种波，但我还是不知道这段波到底啥是什么频率范围的波。
【NLP】文本情感分析
2301_76282081: 博主，你好为什么我的sequential模型输出显示问号，参数位置显示为0，但是最后有结果输出呀
中文分词（上）——获取和Word2Vec模型构建
2301_82254721: stopwords里面都是啥？只有奇怪的字符吗？
【NLP】文本情感分析
坤坤。295: 为什么点击去GitHub下载数据集，点击下载没反应啊

Image Caption

关注

文章平均质量分 93

关注数：文章数：1 文章阅读量：377 文章收藏量：3

作者: Vincy_King

所有人都祝你快乐，我只愿你遍历山河，觉得人间值得。

展开

【Image Captioning】Improve Image Captioning by Estimating the Gazing Patterns from the Caption

CNN等神经网络模型中提取的图像特征中产生类人描述方面达到了良好的性能。然而，之前没有一种明确的方法能够反映人类对图像的感知，比如凝视模式。在本文中，作者假设在image caption中的名词（即实体）及其顺序反映了人类的凝视模式和感知。为此，作者从caption中的单词中预测注视序列gaze sequence，然后训练一个指针网络pointer network来学习在新图像中给定一组object后自动生成gaze sequence。

原创 2022-11-16 14:51:25 · 377 阅读 · 0 评论