自动生成故事线与强化微调提升文档图像理解
在当今数字化的时代,自动生成故事线以及准确理解文档图像信息具有重要意义。前者有助于从大量的社交媒体数据中提取有价值的故事脉络,而后者则能提高企业处理文档的效率和准确性。下面将详细介绍相关的技术和方法。
自动生成故事线
为了衡量故事线生成的性能,研究人员将一种新算法与三种基线方法进行了比较:
- Story Timeline :该方法根据事件中的时间戳来链接事件。它仅利用事件的时间信息生成故事线,没有分析事件之间的相关性。在数据集1上,其正确链接的百分比为0.31。
- Story Forest :此方法基于事件关键词的Jaccard相似系数来链接事件,并提出了合并、扩展和插入等操作,使用增量聚类来更新故事线。它考虑了两个事件之间的相似性。
- Steiner Tree :该方法基于事件相似度构建图,并基于最小权重生成树生成故事线,同样考虑了事件间的相似性,与Story Forest表现相近。
| 方法 | 数据集1 | 数据集2 |
|---|---|---|
| Story Timeline | 0.31 | 0.30 |
| Steiner Tree | 0.41 | 0.39 |
超级会员免费看
订阅专栏 解锁全文
2954

被折叠的 条评论
为什么被折叠?



