标注语料库地图
标注语料库地图用于在二维投影中可视化、聚类文档,并用关键词进行标注。
输入
- 语料库(Corpus):需要可视化的文档集合。
输出
- 选定的文档(Selected Document):从图表中选中的文档。
- 语料库(Corpus):包含额外列的数据,显示文档是否被选中及其所属集群的信息。
- 分数(Scores):按集群平均的关键词分数和p值表格。
标注语料库地图部件以二维散点图的形式展示文档。文档以点集形式显示,横轴属性决定点的水平位置,纵轴属性决定点的垂直位置。部件根据标注设置对文档进行聚类,并为每个集群分配关键词。关键词通过TF-IDF方法提取。
- 横轴(Axis X)与纵轴(Axis Y):选择图表中显示的属性。建议在标注前使用t-SNE部件,并将
t-SNE-x
和t-SNE-y
分别设为横纵轴。 - 标注(Annotation):选