《自然语言处理实战入门》NLP 可视化 ---- 文本内容可视化


文本内容的可视化是以文本内容作为信息对象的可视化。通常, 文本内容的表达包括关键词、短语、句子和主题,文档集合还包括层次性文本内容,时序性文本集合还包括时序性变化的文本内容。

1.基于关键词的内容可视化
2. 时序性文本可视化
3. 文本特征的分布模式可视化
4. 情感分析可视化


基于关键词的文本内容可视化

关键词是从文本的文字描述中提取的语义单元,可反映文本内容的侧重点。关键词可视化指以关键词为单位可视地表达文本内容。关键词的提取原则多种多样,常见的方法是词频,即越是重要的单词,其在文档中出现的频率越高。

标签云(Tag Cloud/Text Cloud/Word Cloud)

标签云(Tag Cloud/Text Cloud/Word Cloud)是最简单、最常用的关键词可视化技术,它直接抽取文本中的关键词并将其按照一定顺序、规律和约束整齐美观地排列在屏幕上。
标签云利用颜色和字体大小反映关键词在文本中分布的差异,比如,用颜色或字体大小,或者它们的组合来表示重要性,越是重要的词汇,其字体越大,颜色越显著,反之亦然。
标签云可视化将经过颜色(或字体大小)映射后的字词按照其在文本中原有的位置或某种布局算法放置。

Wordle是另一种广泛应用的标签云衍化技术。和标签云方法一样,Wordle利用颜色和字体映射关键词的重要性,但Wordle在空间利用和美学欣赏方面有所提升。
整体形状可定制。用 户可自定义画布填充区,比如正方形、圆形或花瓶形状

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

shiter

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值