文章大纲
文本内容的可视化是以文本内容作为信息对象的可视化。通常, 文本内容的表达包括关键词、短语、句子和主题,文档集合还包括层次性文本内容,时序性文本集合还包括时序性变化的文本内容。
1.基于关键词的内容可视化
2. 时序性文本可视化
3. 文本特征的分布模式可视化
4. 情感分析可视化
基于关键词的文本内容可视化
关键词是从文本的文字描述中提取的语义单元,可反映文本内容的侧重点。关键词可视化指以关键词为单位可视地表达文本内容。关键词的提取原则多种多样,常见的方法是词频,即越是重要的单词,其在文档中出现的频率越高。
标签云(Tag Cloud/Text Cloud/Word Cloud)
标签云(Tag Cloud/Text Cloud/Word Cloud)是最简单、最常用的关键词可视化技术,它直接抽取文本中的关键词并将其按照一定顺序、规律和约束整齐美观地排列在屏幕上。
标签云利用颜色和字体大小反映关键词在文本中分布的差异,比如,用颜色或字体大小,或者它们的组合来表示重要性,越是重要的词汇,其字体越大,颜色越显著,反之亦然。
标签云可视化将经过颜色(或字体大小)映射后的字词按照其在文本中原有的位置或某种布局算法放置。
Wordle是另一种广泛应用的标签云衍化技术。和标签云方法一样,Wordle利用颜色和字体映射关键词的重要性,但Wordle在空间利用和美学欣赏方面有所提升。
整体形状可定制。用 户可自定义画布填充区,比如正方形、圆形或花瓶形状